На данном ресурсе находится письменный корпус дигорского диалекта осетинского языка объёмом 2,3 миллиона словоупотреблений. Корпус создан в 2014 г. при финансовой поддержке Программы фундаментальных исследований Президиума РАН «Корпусная лингвистика» (рук. А. П. Выдрин).
По большей части корпус состоит из выпусков газеты «Дигорӕ» за 2006–2014 гг. В корпус входят также несколько номеров литературного журнала на дигорском диалекте «Ирӕф», Нартовский эпос (Нарты. Осетинский героический эпос в трех книгах. Книга 1. М.: Наука. Главная редакция восточной литературы, 1990 (Эпос народов СССР)) и следующие художественные произведения (поэзия, проза) писателей 20 века:
Все тексты, вошедшие в корпус, имеют автоматическую разметку (грамматические категории и полексемный перевод) на русском и английском языках. Доля разобранного материала после автоматической разметки составляет 84%. Для корпуса адаптирована поисковая система Восточноармянского национального корпуса (EANC), позволяющая искать материал по лексеме, словоформе, а также по отдельным грамматическим характеристикам. Во избежание нарушения авторских прав доступ к цельным текстам не предоставляется. Возможности выдачи ограничены контекстом из 7 предложений.
Мы благодарны редакции газеты «Дигорӕ» и литературного журнала «Ирӕф» за предоставление электронных версий своих публикаций.
Корпус создан под руководством А. П. Выдрина. Обработка дигорского словаря осуществлялось Л. В. Клименченко и А. П. Выдриным. Система автоматического морфологического анализа UniParser разработана Т. А. Архангельским. Сканирование отдельных произведений, вошедших в корпус, а также обработка текстов газеты «Дигорӕ» осуществлялось М.В. Дарчиевой.
В настоящее время поддержкой и развитием корпуса занимается А.П. Выдрин.
Любые замечания и предложения просьба отправлять Выдрину Арсению Павловичу по адресу senjacom@gmail.com .
Создатели корпуса будут рады включить в корпус новые опубликованные тексты разной тематики на дигорском диалекте. Тексты принимаются адресу ossetic.studies@gmail.com и senjacom@gmail.com в любом текстовом формате (doc, docx, rtf, txt, odt). Мы гарантируем соблюдение авторских прав и использование присланных текстов только для расширения корпуса дигорского диалекта осетинского языка.