භාෂා තාක්ෂණ පර්යේෂණාගාරය – කොළඹ විශ්ව විද්‍යාලයීය පරිගණක අධ්‍යයනායතනය

සමකාලීන සිංහල වාග් සංහිතාව (වචන මිලියන දහයකින් සමන්විතයි.)

ඉංග්‍රීසි - සිංහල සමාන්තර වාග් සංහිතාව

සිංහල සංකේත වාග් සංහිතාව (වචන ලක්ෂ පහකින් සමන්විතයි.)

UCSC සිංහල වදන්දැල (වචන 1300ක් සඳහා)

UCSC සිංහල වාග් ගොනු සංකේතාවලිය

සිංහල සංඥා නාමාවලිය

NamedEntity Tagged Corpus

සිංහල ව්‍යාකරණ වචනාවලිය

ඉඟිය ඉංග්‍රීසි-සිංහල ශබ්දකෝෂ දත්ත ගොනුව

සිංහල ඒකරූපී වචනාවලිය

කථන සිංහල වාග් සංහිතාව