உள்ளூர் மொழி நுழைவாயில்

சொல் வளங்கள்

பாத் நிர்வாணா சிங்கள டி.டி.எஸ் தரவுத்தொகுப்பு

உரையிலிருந்து பேச்சு வழிமுறைப் பயிற்சிக்கான உயர் தரமான சிங்களத் தரவுத்தொகுப்பு – ஆழ்ந்த கற்றல் வழிமுறைகளுக்கென (deep learning algorithms) சிறப்பாக வடிவமைக்கப்பட்டுள்ளது.

ஆழ்ந்த கற்றல் வழிமுறைகளைப் பயன்படுத்தி புதிய சிங்கள டி.டி.எஸ் குரல்களை உருவாக்கப் பயன்படுத்தக்கூடிய புதிய தரவுத்தொகுப்பு இப்போது கீழே கிடைக்கிறது:
https://github.com/pathnirvana/sinhala-tts-dataset

மொழி தொழினுட்ப ஆராய்ச்சி ஆய்வுகூடம் – யு.சி.எஸ்.சி. (UCSC)

மொழி ஆராய்ச்சிக்கு 10-மில்லியன்-சொல் சமகால சிங்கள உரை விரிதரவு

100K சொல் ஆங்கிலம், சிங்கள இணை விரிதரவு

500k சிங்கள குறியிடப்பட்ட விரிதரவு

மொழி தொழினுட்ப முன்னேற்றத்திற்காக 1300 சொல் சிங்கள வேர்ட்நெட்

யு.சி.எஸ்.சி சிங்கள பிஓஎஸ் டேக்செட்

மொழி ஆராய்ச்சிக்கான சரியான பெயர்களின் பட்டியல்

NamedEntity குறியிடப்பட்ட விரிதரவு

சிங்கள செயற்பாட்டுச் சொற்களின் பட்டியல்

இங்கியா ஆங்கிலம்-சிங்களம் அகராதி தரவுத்தளம்

400K தனித்துவ சொல் பட்டியல்

சிங்கள பேச்சு செயலாக்கத்திற்கான பேச்சு விரிதரவுகள் (Speech corpora)