Технические науки

ALGORITHM OF CLASSIFICATION OF SCIENTIFIC TEXTS BY THE METHOD OF LATENT SEMANTIC ANALYSIS [АЛГОРИТМ КЛАССИФИКАЦИИ НАУЧНЫХ ТЕКСТОВ ПРИ ПОМОЩИ ЛАТЕНТНО-СЕМАНТИЧЕСКОГО АНАЛИЗА]

Ismukanova A.N., Lavrov D.N., Keldybekova L.М., Mukunova M.Zh.

Email: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Ismukanova Aygerim Nauryzbayevna - Postgraduate Student,

DEPARTMENTS OF COMPUTER TECHNOLOGIES AND NETWORKS;

Lavrov Dmitry Nikolaevich - PhD in Engineering, Associate Professor, Head of the Department,

DEPARTMENTS OF COMPUTER TECHNOLOGIES AND NETWORKS, FACULTY OF COMPUTER SCIENCES,

OMSK STATE UNIVERSITY NAMED AFTER F.M. DOSTOYEVSKY,

OMSK;

Keldybekova Liliya Muratbekovna - Teacher;

Mukunova Marzhan Zhumanovna – Teacher,

DEPARTMENT OF FOREIGN LANGUAGES, FACULTY OF "PHILOLOGY",

KOKSHETAU STATE UNIVERSITY NAMED AFTER SH. UALIKHANOV,

KOKSHETAU, REPUBLIC OF KAZAKHSTAN

Abstract: during the past two decades the study of scientific texts focused on the factors affecting the understanding of the language. However, at presents there are no studies in the field of computer technology, capable of accurate assessment of the classification of the scientific text. New technologies for the LSA model could represent a important advance of the assessment of scientific texts.

LSA model despite the complexity of the opacity and can be used for a number of different tasks with a generalization or extension of the meaning of the search query.

The Latent semantic analysis (Latent Semantic Analysis (LSA)) - the theory and a method for extraction, and submission of the contents of contextual use of words statistical calculations was applied to a large number of texts. The latent semantic analysis (LSA) – is the semantic domain defining mathematical representation of computing linguistic model. Works on improvement and adaptation to various tasks of the latent semantic analysis (LSA) are conducted long ago languages.

Keywords: latent semantic analysis (LSA), artificial intelligence (AI), artificial neural network (ANNs), machine learning (ML), classification.

Исмуканова А.Н., Лавров Д.Н., Кельдыбекова Л.М., Мукумова М.Ж.

Исмуканова Айгерим Наурызбаевна - аспирант,

кафедра компьютерных технологий и сетей;

Лавров Дмитрий Николаевич - кандидат технических наук, доцент, заведующий кафедрой,

кафедра компьютерных технологий и сетей, факультет компьютерных наук,

Омский государственный университет им. М.Ф. Достоевского,

г. Омск;

Кельдыбекова Лилия Муратбековна - преподаватель;

Мукумова Маржан Жумановна – преподаватель,

кафедра иностранных языков, факультет филологии,

Кокшетауский государственный университет им. Ш. Уалиханова,

г. Кокшетау, Республика Казахстан

Аннотация: в течение прошлых двух десятилетий исследование научных текстов фокусировалось на факторах, влияющих на понимание языка. Однако в настоящее время отсутствуют исследования в области компьютерных технологий, способных к точной оценке классификации научного текста. Новые технологии для модели LSA (латентно-семантического анализа) могли представлять важное усовершенствование в исследовании оценки научных текстов.

Модель LSA, несмотря на трудоемкость и непрозрачность, может использоваться для разного ряда задач при обобщении или расширении смысла поискового запроса.

Латентно-семантический анализ (Latent Semantic Analysis (LSA)) - теория и метод для извлечения и представления содержания контекстного использования слов статистическими вычислениями применялось к большому количеству текстов. Латентно-семантический анализ (LSA) является семантическим доменом, определяющим математическое представление вычислительной лингвистической модели. Работы по усовершенствованию и адаптации к различным задачам латентного семантического анализа (LSA) ведутся давно.

Ключевые слова: латентный семантический анализ (ЛСА), искусственные нейронные сети (ANNs), машинное обучение (МА), классификация.

References in English / Список литературы на английском языке

  1. Denhière G., Lemaire B., Bellissens C. & Jhean-Larose S., 2007. A semantic space modeling children’s semantic memory. In T.K. Landauer, D.McNamara, S. Dennis & W. Kintsch (Eds.). The handbook of latent semantic analysis. Mahwah, NJ: Erlbaum. PP. 143-167
  2. Landauer T.K., Foltz P., Laham D. An Introduction to Latent Semantic Analysis. Discours Processes. 25, 1998. PP. 259-284.

Список литературы / References

  1. Денхиер Г., Лемер Б., Беллиссенс К. & Джхин-Лэроз С., 2007. Семантическое пространство, моделируя детскую семантическую память. В Т.К. Лэндоере, Д. Макнамаре, S. Dennis, & W. Kintsch (Редакторы). Руководство скрытого семантического анализа. Мово. Нью-Джерси: Erlbaum. С. 143-167.
  2. Ландауер T.K., Фолц П., Лэхэм Д. Введение в скрытый семантический анализ. Процессы Discours, 25, 1998. С. 259-284.

Ссылка для цитирования данной статьи

scientific publication copyright    

Cсылка для цитирования на русском языке. Исмуканова А.Н., Лавров Д.Н., Кельдыбекова Л.М., Мукумова М.Ж. АЛГОРИТМ КЛАССИФИКАЦИИ НАУЧНЫХ ТЕКСТОВ ПРИ ПОМОЩИ ЛАТЕНТНО-СЕМАНТИЧЕСКОГО АНАЛИЗА // European science № 1(33), 2018. C. {см. журнал}

scientific publication pdf

Поделитесь данной статьей, повысьте свой научный статус в социальных сетях

        
  
  

Похожие статьи: