В мировой сети заработал сайт Национального корпуса башкирского языка — результат безвозмездного сотрудничества специалистов по компьютерной лингвистике и языковых активистов сообщества «Башкирские проекты», сообщает «Башинформ».
Корпус появился на базе специальной компьютерной программе, способной делать морфологический анализ башкирской словоформы. Программа создана доцентом Школы лингвистики Национального исследовательского университета «Высшая школа экономики» (Москва) Борисом Ореховым, уроженцем Уфы.
Сейчас в корпусе башкирского языка более 20 миллионов словоупотреблений, что соответствует примерно 180 томам бумажных книг. В корпус включены художественные произведения, законы, газетные и журнальные статьи, некоторые статьи башкирского раздела Википедии.
— Мы очень надеемся, что люди и организации, заинтересованные в развитии башкирского языка, помогут нам сделать корпус лучше», — рассказал агентству «Башинформ» главный разработчик Национального корпуса башкирского языка Борис Орехов.
Прокомментировать