82
Лаборатория лингвистики и информационных технологий Лаборатория создана при ИИЯЛ в 2000 г. для исполнения пунктов по информатизации башкирского языка, принятых в Меропрятиях Государственной программы сохранения, изучения и развития языков народов Республики Башкортостан

Лаборатория лингвистики и информационных технологий

  • Upload
    ashby

  • View
    106

  • Download
    0

Embed Size (px)

DESCRIPTION

Лаборатория лингвистики и информационных технологий. Лаборатория создана при ИИЯЛ в 2000 г. для исполнения пунктов по информатизации башкирского языка, принятых в Меропрятиях Государственной программы сохранения, изучения и развития языков народов Республики Башкортостан. - PowerPoint PPT Presentation

Citation preview

Page 1: Лаборатория лингвистики и информационных технологий

Лаборатория лингвистики и информационных технологий

Лаборатория создана при ИИЯЛ в 2000 г. для исполнения пунктов по информатизации башкирского языка, принятых в Меропрятиях Государственной программы сохранения, изучения и развития языков народов Республики Башкортостан

Page 2: Лаборатория лингвистики и информационных технологий

Лаборатория лингвистики и информационных технологий

В лаборатории работают 6 человек:

заведующий – 0,4 ставки

снс, к.ф.н. Бускунбаева Л.А. – 1 ст.

мнс Ишмухаметова А.Ш. – 1 ст.

ст. лаб. Ибрагимова А.Д. – 1 ст.

ст. лаб. Рафикова Л.Р. – 1 ст.

ст. лаб. Мигранова Л.Г. – 1 ст.

Page 3: Лаборатория лингвистики и информационных технологий

Научная деятельность лаборатории за 2006-2010 гг.

Кандидатская диссертация – 1 Работа на диссертацией - 3

Page 4: Лаборатория лингвистики и информационных технологий

Публикации лаборатории за 2006-2010 гг.

Научные статьи – 28 Монографии и словари 5

Page 5: Лаборатория лингвистики и информационных технологий

Монографии и словари

Сиразитдинов З.А., Шамсутдинова Г.Г. Частотный словарь языка публицистики. Уфа, Гилем-2006.

Хисамитдинова Ф.Г., Сиразитдинов З.А. Русско-башкирский словарь-справочник водных объектов РБ. Уфа, 2007.

Бускунбаева Л.А. Хисамитдинова Ф.Г., Сиразитдинов З.А., Суфьянова Н.Ф.

Русско-башкирский словарь-справочник названий улиц городов РБ. Уфа – 2009.

Сулеманов В.С., Сиразитдинов З.А. Русско-башкирский словарь астрономических терминов. Уфа, 2009.

Page 6: Лаборатория лингвистики и информационных технологий

Публикации лаборатории в 2010 г.

Ишмухаметова А. Ш. К квантитативно-статистическому методу изучения языка эпосов/Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010

Сиразитдинов З.А. К вопросу об автоматическом порождении словоизменительных форм глаголов башкирского языка/Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010

Сиразитдинов З.А. Информационная лингвистическая система “машинный фонд башкирского языка” /Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010

Сиразитдинов З.А., Полянин А.И., Ибрагимова А.Д. О статистике посещения машинного фонда башкирского языка/Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010

Бускунбаева Л. А. Явление субституции в башкирском языке/ Материалы научной конференции Урал-Алтай: через века в будущее. Уфа, 2010

Сиразитдинов З.А., Бускунбаева Л.А., Каримоав Р.Н. О текстологической базе данных диалектологического подфонда “Машинного фонда башкирского языка”/

Сиразитдинов З.А., Ибрагимова А.Д., Ишмухаметова А.Ш. Диалектологический подфонд машинного фонда башкирского языка/Актуальные проблемы диалектологии языков народов России. Уфа, 2010

Сиразитдинов З.А. К проблеме автоматического порождения глагольных словоизменений башкирского языка/

Бускунбаева Л.А., Ишмухаметова А.Ш./ Сиразитдинов З.А. о составлении морфологической базы данных/ в печати

словоизменения именных и глагольных форм башкирского языка /в печати

Page 7: Лаборатория лингвистики и информационных технологий

Лаборатория лингвистики и информационных технологий

В 2006-2010 гг. лабораторией проведены работы:

Работа с компанией Paratype по созданию 18 башкирских шрифтов в кодировке Unicode (2006-2007 гг.).

Совместная работа с Microsoft по реализации поддерки башкирскому языку в ОС Windows (Vists, Windows) (2006-2009).

Работа с компанией ЛИНУКС ИНК (Санкт-Петербург) по разработке пилотного проекта по внедрению и поддержке программных решений построенных на базе Open Source продуктов (2008 г.).

Разработка информационной системы Машинный фонд башкирского языка (2006-2010 гг.).

Page 8: Лаборатория лингвистики и информационных технологий

Работа по башкирским шрифтам (с Paratype)

Корректировка дизайна башкирских букв. Тестирование шрифтов в разных версиях

текстовых (Word, PageMaker, QExpres) и графических (Coral, Photoshop) редакторов.

Распространение шрифтов по организациям и консультирование.

Page 9: Лаборатория лингвистики и информационных технологий

Список разработанных шрифтов

Шрифт Academy Шрифт Baltica Шрифт Literaturnajaj Шрифт Pragmatica Шрифт Arabskij Шрифт Decor Шрифт Newton Шрифт PT Sans Шрифт Bodoni Шрифт CourRoug Шрифт Futura Шрифт JournSan Шрифт PragShad Шрифт Lazurski Шрифт NewJourn Шрифт ITCChart Шрифт Bannikov Шрифт Courier

Page 10: Лаборатория лингвистики и информационных технологий
Page 11: Лаборатория лингвистики и информационных технологий
Page 12: Лаборатория лингвистики и информационных технологий

Работа с Microsoft

Передача раскладки башкирской клаваитуры.

Перевод системных сообщений. Тестирование отладочных версий ОС

Vista Тестирование отладочных версий ОС

Windows 7

Page 13: Лаборатория лингвистики и информационных технологий

Раскладка башкирской клавиатуры для Microsoft

Page 14: Лаборатория лингвистики и информационных технологий
Page 15: Лаборатория лингвистики и информационных технологий
Page 16: Лаборатория лингвистики и информационных технологий
Page 17: Лаборатория лингвистики и информационных технологий
Page 18: Лаборатория лингвистики и информационных технологий

Работа с компанией ЛИНУКС ИНК (Санкт-Петербург)

Согласование раскладки клавиатуры. Тестирование шрифтов Паратайпа в

Линукс. Тестирование самой работы ОС Нау

Линукс.

Page 19: Лаборатория лингвистики и информационных технологий
Page 20: Лаборатория лингвистики и информационных технологий

Машинный фондбашкирского языка http://mfbl.ru

Машинный фонд башкирского языка (МФ БЯ) — это специально разработанная для лингвистов, преподавателей башкирского языка, студентов и учащихся старших классов система поиска филологической информации.

Page 21: Лаборатория лингвистики и информационных технологий

Структура машинного фондабашкирского языка http://mfbl.ru

Графический интерфейс

Программное обеспечение на обработку запроса

Программное обеспечение на редактирование базы данных

База

1

База

2

База

3

База

4

База

5

База

6

База

7

Page 22: Лаборатория лингвистики и информационных технологий

Машинный фонд башкирского языка http://mfbl.ru

Машинный фонд башкирского языка представляет собой информационно-поисковую систему и включает следующие подфонды (блоки)

Генеральная картотека Лексикографический подфонд Грамматический подфонд Экспериментально-фонетический подфонд Подфонд «Каталог рукописных книг» Подфонд «Каталог старопечатных книг» Диалектологический подфонд

Page 23: Лаборатория лингвистики и информационных технологий

Генеральная картотека. Структура представления информации

слово пометы

парадигма… парадигма… парадигма…

иллюстрация… иллюстрация… иллюстрация

выход. данные… выход. данные… выход. данные

http://mfbl.ru

Page 24: Лаборатория лингвистики и информационных технологий

Генеральная картотека. Система лексикографических помет.

Пометы:

часть речи

происхождение

нарицательное/собственное

диалектное/литературное

устаревшее/неологизм

стилистические

http://mfbl.ru

Page 25: Лаборатория лингвистики и информационных технологий

Генеральная картотека http://mfbl.ru

Включает слова активного и пассивного пластов башкирского языка

Количество зафиксированных лексем — 92034 единиц.

Количество иллюстрационного материала — 83757 единиц.

Page 26: Лаборатория лингвистики и информационных технологий

Генеальная картотека

Page 27: Лаборатория лингвистики и информационных технологий
Page 28: Лаборатория лингвистики и информационных технологий
Page 29: Лаборатория лингвистики и информационных технологий
Page 30: Лаборатория лингвистики и информационных технологий
Page 31: Лаборатория лингвистики и информационных технологий

Объем лексикографической базы http://mfbl.ru

Общее количество словарей — 47: Двуязычные общефилологические – 5 Двуязычные терминологичекие словари — 31 Одноязычные словари — 4 Частотные словари — 3 Словари-справочники — 4 Общий объем лексикографической базы —

654000 словарных статей

Page 32: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Двуязычные общефилологические словори (с башкирского языка):

Башкирско-русский (академический) Башкирско-английский

Page 33: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Двуязычные общефилологические словори (на башкирский язык):

Русско-башкирский (академический 2-х томник) Русско-башкирский (Ураксин, 2004) Англо-башкирский

Page 34: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Терминологические словари по пчеловодству по животноводству по зоологии по ботанике по лесному делу сельскохозяйственных терминов экономических терминов общественно-политических терминов юридических терминов медицинских терминов педагогических и психологических теминов по черчению по физике по астрономии по технике по математике по информатике по химии по географии по изобразительному искусству для работников торговли и общественного питания

Page 35: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Одноязычные словари толковый словарь башкирского языка фразеологический словарь синонимический словарь орфографический словарь

Page 36: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Словари-справочники Русско-башкирский словарь-справочник названий

населенных пунктов РБ Русско-башкирский словарь-справочник водных

объектов РБ Русско-башкирский словарь-справочник названий

улиц городов РБ Русско-башкирский словарь-справочник названий

горных объектов РБ Словарь арабских и персидских заимствований в

башкирском языке

Page 37: Лаборатория лингвистики и информационных технологий

Лексикографический подфонд

Частотные словари: частотный словарь языка науки частотный словарь языка публицистики частотный словарь языка прозы частотный словарь языка произведений

Д.Юлтыя частотный словарь эпоса Урал-батыр

Page 38: Лаборатория лингвистики и информационных технологий
Page 39: Лаборатория лингвистики и информационных технологий
Page 40: Лаборатория лингвистики и информационных технологий
Page 41: Лаборатория лингвистики и информационных технологий
Page 42: Лаборатория лингвистики и информационных технологий
Page 43: Лаборатория лингвистики и информационных технологий
Page 44: Лаборатория лингвистики и информационных технологий

Расположение ссылки на Русско-башкирский словарь на сайте БГУ http://mfbl.ru/bash/rusbash

Page 45: Лаборатория лингвистики и информационных технологий

Вид начальной страницы русско-башкирского словаря http://mfbl.ru/bash/rusbash

Page 46: Лаборатория лингвистики и информационных технологий

Пример выдачи перевода в русско-башкирском словаре http://mfbl.ru/bash/rusbash

Page 47: Лаборатория лингвистики и информационных технологий

Грамматический подфонд(академическая грамматика башкирского языка) http://mfbl.ru

Page 48: Лаборатория лингвистики и информационных технологий
Page 49: Лаборатория лингвистики и информационных технологий

Экспериментально-фонетический подфонд http://mfbl.ru

Page 50: Лаборатория лингвистики и информационных технологий

Экспериментально-фонетический подфонд http://mfbl.ru

Page 51: Лаборатория лингвистики и информационных технологий

Экспериментально-фонетический подфонд http://mfbl.ru

Page 52: Лаборатория лингвистики и информационных технологий

Фрагмент фонетического словаря(объем словаря 8000 единиц) http://mfbl.ru

Page 53: Лаборатория лингвистики и информационных технологий

Подфонд рукописных книг http://mfbl.ru

Page 54: Лаборатория лингвистики и информационных технологий
Page 55: Лаборатория лингвистики и информационных технологий

Подфонд старопечатных книг http://mfbl.ru

Page 56: Лаборатория лингвистики и информационных технологий
Page 57: Лаборатория лингвистики и информационных технологий

Подфонды старопечатных и рукописных книг http://mfbl.ru

Общий объем каталогов старопечатных и рукописных книг составляет описания более 3000 книг

Page 58: Лаборатория лингвистики и информационных технологий

Диалектологического подфонда

Диалектологический подфонд

лексическая база

база диалектологического

атласа

текстологическая база

Page 59: Лаборатория лингвистики и информационных технологий

Лексическая база данных диалектологического подфонда http://mfbl.ru

В лексическая база диалектологического подфонда содержит более 52000 лексических единиц с шестью информационными полями:

диалектное слово; часть речи, диалект, говор, литературная норма, русский перевод.

Page 60: Лаборатория лингвистики и информационных технологий

Лексическая база данных диалектологического подфонда http://mfbl.ru

Page 61: Лаборатория лингвистики и информационных технологий
Page 62: Лаборатория лингвистики и информационных технологий
Page 63: Лаборатория лингвистики и информационных технологий
Page 64: Лаборатория лингвистики и информационных технологий

База данных диалектологического атласаhttp://mfbl.ru

База данных диалектологического атласа содержит 170 карт с изоглоссами по диалектам и говорам башкирского языка.

Для атласа выбраны 250 населенных пунктов РБ и областей РФ, где проживают башкиры.

В работе использованы материалы диалектологических экспедиций сотрудников ИИЯЛ.

Page 65: Лаборатория лингвистики и информационных технологий
Page 66: Лаборатория лингвистики и информационных технологий
Page 67: Лаборатория лингвистики и информационных технологий
Page 68: Лаборатория лингвистики и информационных технологий
Page 69: Лаборатория лингвистики и информационных технологий

Текстологическая база диалектологического подфондаhttp://mfbl.ru

Структура базы данных

диалект говор год записи диалектный текст образование информатора

пол информатора возраст информатора национальность

Page 70: Лаборатория лингвистики и информационных технологий

Текстологическая база диалектологического подфондаhttp://mfbl.ru

Page 71: Лаборатория лингвистики и информационных технологий
Page 72: Лаборатория лингвистики и информационных технологий

Текстологическая база диалектологического подфондаhttp://mfbl.ru

Все параметры, за исключением года записи, выбираются из ниспадающего меню. Год записи пользователь вводит сам. Образование включает следующие поля фиксации: без образования, начальное, неполное среднее, среднее, среднее техническое, высшее.

Возраст информатора задается в виде шкалы лет: 5-10, 11-20, 21-30, 31-40, 41-50, 51-60, 31-70, 71-80, 81-90, 91-100.

Программное обеспечение позволяет производить поиск текстов по любому из 7 параметров или по комбинации этих параметров.

Текстологическая база данных позволит быстро выбирать иллюстрационный материал для лингвистических исследований и явится ценным аппаратом и источником данных для социолингвистических исследований на уровне носителей диалектов.

Page 73: Лаборатория лингвистики и информационных технологий

Текстологическая база диалектологического подфондаhttp://mfbl.ru

Объем текстологической базы данных на данное время составляет 500 текстов.

Page 74: Лаборатория лингвистики и информационных технологий

Представление география посещаемости системы в машинном фонде http://mfbl.ru

Page 75: Лаборатория лингвистики и информационных технологий
Page 76: Лаборатория лингвистики и информационных технологий

Диаграмма географии посещения серверас Машинным фондом башкирского языка(единица учета — количество посещений) http://mfbl.ru

РБ РФ Дальнее зарубежье Ближнее зарубежье

Page 77: Лаборатория лингвистики и информационных технологий

Диаграмма посещаемости разделовМашинного фонда (единицей учета является количество

обращений на поиск) http://mfbl.ru

Лексикографическая базаГенеральная картотекаГрамматическая базаЭкспериментально-фонетическая базаКаталог старопечатныхкнигКаталог рукописных книгДиалектологическая база

Page 78: Лаборатория лингвистики и информационных технологий
Page 79: Лаборатория лингвистики и информационных технологий

Работа лаборатории в 2010 г.

Введены описания 300 старопечатных книг. Введены описания 200 рукописных книг. Введено в генеральную картотеку 5000 карточек с

иллюстративными материалами. Введены в подфонд следующие словари: синонимический,

башкирско-турецкий, турецко-башкирский, частотный словарь языка произведений Д.Юлтыя, конкорданс и частотный словарь языка эпоса Урал-батыр; 9 терминологических словарей: по медицине (по ред. Азнабанва Р.), географии, библиотечному делу, физике, дипломатии, горным объектам, химии, этике, мифологии.

Page 80: Лаборатория лингвистики и информационных технологий

Работа лаборатории в 2010 г.

В морфологическом подфонде создана новая база — база квантитативных данных морфологического подфонда. На основе анализа текстов общим объемом в 600 000 словоформ по трем функциональным стилям: наука, художественная проза, публицистика получены количественно-статистические данные грамматических категорий словоизменения именных и глагольных форм башкирского языка.

Page 81: Лаборатория лингвистики и информационных технологий

Работа лаборатории в 2010 г.

В текущем году создан блок для выдачи статистических данных посещаемости отдельных подфондов машинного фонда и выдачи географии посещения.

Page 82: Лаборатория лингвистики и информационных технологий

Финансирование лаборатории

2006 г. — 200,0 тыс. рублей. 2007 г. — 500,0 тыс. руб. 2008 г. — 1280,0 тыс. руб 2009 г. — 1300,0 тыс. руб. 2010 г. — 1600,0 тыс. руб.