දේශීය භාෂා බිහිදොර

වාග් සම්පත්

නිර්වාණ මඟ සිංහල පෙළ සිට කථන දත්ත කාණ්ඩ

High Quality Sinhala dataset for Text to speech algorithm training – specially designed for deep learning algorithms.

A new dataset that can be used for building new Sinhala TTS voices using deep learning algorithms is now available below:
https://github.com/pathnirvana/sinhala-tts-dataset

භාෂා තාක්ෂණ පර්යේෂණාගාරය – කොළඹ විශ්ව විද්‍යාලයීය පරිගණක අධ්‍යයනායතනය

සමකාලීන සිංහල වාග් සංහිතාව (වචන මිලියන දහයකින් සමන්විතයි.)

ඉංග්‍රීසි - සිංහල සමාන්තර වාග් සංහිතාව

සිංහල සංකේත වාග් සංහිතාව (වචන ලක්ෂ පහකින් සමන්විතයි.)

UCSC සිංහල වදන්දැල (වචන 1300ක් සඳහා)

UCSC සිංහල වාග් ගොනු සංකේතාවලිය

සිංහල සංඥා නාමාවලිය

NamedEntity Tagged Corpus

සිංහල ව්‍යාකරණ වචනාවලිය

ඉඟිය ඉංග්‍රීසි-සිංහල ශබ්දකෝෂ දත්ත ගොනුව

සිංහල ඒකරූපී වචනාවලිය

කථන සිංහල වාග් සංහිතාව