Матнларни таҳлил қилиш иловалари

Mualliflar

  • “Тошкент ирригация ва қишлоқ хўжалигини механизациялаш муҳандислари институти” миллий тадқиқот университети
  • "Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
  • "Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
  • Тошкент менежмент ва иқтисодиёт институти

Annotasiya

Ушбу маколада матнли маълумотларни тахлил қилиш ва таснифлаш жараёнлари тахлил этилган бўлиб, матнли маълумотлар турлари, яъни структураланган, структураланмаган ва ярим структураланган маълумотлар кўриб чиқилди ха мда уларни хусусиятлари келтириб ўтилди. Бундан ташкари, узбек тилидаги матнли маълумотларни қайта ишлаш бўйича мавжуд имкониятлар ва муаммоларга алохида эътибор каратилди. Хусусан, “Tahrirchi” тизими мисолида ўзбек тилидаги матнли маълумотларни тахлил қилишдаги ютуқлар ва камчиликлар келтириб ўтилди.

Kalit so‘zlar:

Матнли маълумотлар қайта ишлаш таснифлаш табиий тилни қайта ишлаш (NLP) структураланган маълумотлар структураланмаган маълумотлар “Tahrirchi” интеллектуал таҳлил машинали ўқитиш семантик таҳлил морфологик таҳлил алгоритмлар сунъий интеллект орфографик таҳлил

Muallif tarjimai holi

Нилуфар Ниёзматова,
“Тошкент ирригация ва қишлоқ хўжалигини механизациялаш муҳандислари институти” миллий тадқиқот университети
“Рақамли технологиялар ва сунъий интеллект” кафедраси к.и.х.
Нарзулло Маматов,
"Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
“Рақамли технологиялар ва сунъий интеллект” кафедраси мудири, профессор
Нафисахон Турғунова,
"Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
“Рақамли технологиялар ва сунъий интеллект” кафедраси ассистенти
Шаҳноза Туракулова,
Тошкент менежмент ва иқтисодиёт институти
ассистенти

background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

13

до 45,15 млрд долларов США, а среднегодовой темп роста составит 15,7% в период с 2023
по 2032 год [5].

Список литературы

1.

Т.Ф. Бекмуратов. Интеллектуализация цифровой экономики - инновационные

подходы и перспективные направления развития. Инновацион ёндашувлар илм-фан
тараққиёти калити сифатида: ечимлар ва истиқболлар. Мавзусидаги республика
миқиёсидаги илмий-техник анжумани материаллари тўплами (2020 йил 8-10
октябрь).Джизак.

2.

Marco Iansiti, Karim R. Lakhani. Competing in the age of ai. Harvard business review

press, Boston. https://hbr.org/2020/01/competing-in-the-age-of-ai.

3.

Blaise Aguera y Arcas, “What Is AMI?” Medium, February 23.

4.

Марк Пёрди и А. Марк Уильямс.

https://hbr.org/2023/10/how-ai-can-help-leaders-make-better-decisions-under-pressure.
5.

Интеллектуальные технологии в экономике: революция в мире бизнеса

https://cyberleninka.ru/article/n/intellektualnye-tehnologii-v-ekonomike-revolyutsiya-v-mire-
biznesa.

МАТНЛАРНИ ТАҲЛИЛ ҚИЛИШ ИЛОВАЛАРИ

Ниёзматова Нилуфар Аълохановна

“Рақамли технологиялар ва сунъий интеллект” кафедраси к.и.х.

“ТИҚХММИ” Миллий тадқиқот университети

Маматов Нарзулло Солиджонович

“Рақамли технологиялар ва сунъий интеллект” кафедраси мудири, профессор

“ТИҚХММИ” Миллий тадқиқот университети

Турғунова Нафисахон Махаммаджон қизи

“Рақамли технологиялар ва сунъий интеллект” кафедраси ассистенти

“ТИҚХММИ” Миллий тадқиқот университети

Туракулова Шаҳноза Абдурашидовна

Тошкент менежмент ва иқтисодиёт институти ассистенти


Аннотация:

Ушбу мақолада матнли маълумотларни таҳлил қилиш ва таснифлаш

жараёнлари таҳлил этилган бўлиб, матнли маълумотлар турлари, яъни структураланган,
структураланмаган ва ярим структураланган маълумотлар кўриб чиқилди ҳамда уларни
хусусиятлари келтириб ўтилди. Бундан ташқари, ўзбек тилидаги матнли маълумотларни
қайта ишлаш бўйича мавжуд имкониятлар ва муаммоларга алоҳида эътибор қаратилди.
Хусусан, “Tahrirchi” тизими мисолида ўзбек тилидаги матнли маълумотларни таҳлил
қилишдаги ютуқлар ва камчиликлар келтириб ўтилди.

Калит сўзлар:

Матнли маълумотлар, қайта ишлаш, таснифлаш, табиий тилни қайта

ишлаш (NLP), структураланган маълумотлар, структураланмаган маълумотлар, “Tahrirchi”,
интеллектуал таҳлил, машинали ўқитиш, семантик таҳлил, морфологик таҳлил,
алгоритмлар, сунъий интеллект, орфографик таҳлил.

ПРОГРАММЫ ДЛЯ АНАЛИЗА ТЕКСТА

Аннотация

: В данной статье анализируется процесс анализа и классификации

текстовых данных, рассматриваются типы текстовых данных, т. е. структурированные,
неструктурированные и полуструктурированные данные, а также выделяются их


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

14

характеристики. Кроме того, особое внимание было уделено существующим возможностям
и проблемам обработки текстовых данных на узбекском языке. В частности, на примере
системы «Tahrirchi» были представлены достижения и недостатки в анализе текстовых
данных на узбекском языке.

Ключевые слова

: Текстовые данные, обработка, классификация, обработка

естественного языка (NLP), структурированные данные, неструктурированные данные,
«Tahrirchi», интеллектуальный анализ, машинное обучение, семантический анализ,
морфологический анализ, алгоритмы, искусственный интеллект, орфографический анализ.

TEXT ANALYSIS APPLICATIONS

Abstract

: This article analyzes the processes of analyzing and classifying textual data,

considers the types of textual data, namely structured, unstructured and semi-structured data, and
presents their characteristics. In addition, special attention is paid to the existing opportunities and
problems in processing textual data in the Uzbek language. In particular, the achievements and
shortcomings of analyzing textual data in the Uzbek language using the example of the "Tahrirchi"
system are presented.

Keywords

: Textual data, processing, classification, natural language processing (NLP),

structured data, unstructured data, "Tahrirchi", intelligent analysis, machine learning, semantic
analysis, morphological analysis, algorithms, artificial intelligence, orthographic analysis.


Матнли маълумотларни таснифлаш табиий тилни қайта ишлаш (NLP – Natural

Language Processing) доирасида ҳал қилинадиган ва кенг тарқалган муаммолардан биридир
[1]. Матнли маълумотларни таснифлаш учун машинали ўқитиш усулларидан фойдаланиш
турли масалалар, хусусан, янгиликлар ва ҳужжатларни таснифлаш, спам-филтрлаш, шарҳ
ҳиссий оҳангини аниқлаш, кабиларда кенг қўлланилади [2].

Маълумотлар базасига кўра, ундаги маълумотлар қуйидаги тартибга келтирилиши

мумкин:

Структураланган: маълумотлар кўп сонли қатор ва устунлар билан жадвал

кўринишида стандартлаштирилган бўлиб, уларни таҳлил қилиш ва машинали ўқитиш
алгоритмлари учун сақлаш ҳамда қайта ишлашни осонлаштиради. Масалан,
структураланган маълумотлар исмлар, манзиллар ва телефон рақамлари каби
маълумотларни ўз ичига олади.

Структураланмаган: маълумотлар олдиндан белгиланган маълумотлар форматига

эга эмас. Улар ижтимоий медиа ёки маҳсулот шарҳлари каби манбалардан олинган
матнларни ёки видео ва аудио файллар каби медиа форматларини ўз ичига олади.

Ярим структураланган: маълумотлар структураланган ва структураланмаган

маълумотлар форматлари аралашмаси бўлиб, уларга XML, JSON ва HTML файллари
киради [3].

Структураланмаган маълумотлар статистикасига кўра, рақамли дунёдаги

маълумотларни тахминан 80%и тузилмага эга эмас. Ҳозирги кундаги маълумотларни
аксарияти қидириш ёки саралаш осон бўлган стандартлаштирилган форматга мос келмайди
[4].

Маълумотларни интеллектуал таҳлил қилиш машинали ўқитиш, табиий тилни қайта

ишлаш, ахборотни қидириш, билимларни бошқариш ва таснифлаш соҳаларида юзага
келадиган муаммоларни ҳал қилишга қаратилган компьютер фанлари бўйича янги тадқиқот
соҳаси ҳисобланади [5].


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

15

Ушбу илмий ишда асосий мақсад матнни қайта ишлаш иловаларини ўрганиш,

структураланмаган маълумотларни тузилмага келтириш ва матн таркибидаги сўзларни
хатосиз ёзилиши ҳамда интеллектуал таҳлил учун зарур босқичларни бажариш
қобилиятлари текширилади. Шунингдек, матнни нормаллаштириш учун дастурлар
имкониятларини таққосланади.

Одатда матнни интеллектуал таҳлил қилиш қуйидаги босқичларда амалга оширилади:
1. Масаланинг қўйилиши - матнни таҳлил қилиш учун муаммо ва мақсадни аниқлаш;
2. Ҳужжатларни танлаш - матнни интеллектуал таҳлили учун олдиндан тузилган

аналитик мақсадлар асосида тегишли потенциал ҳужжатлар аниқланади;

3. Ҳужжатларни қайта ишлаш - матнни таҳлил қилиш қўшимча равишда

хусусиятларни ажратиб олишни талаб қилади, ундан атамалар олинади, сўнгра
ҳужжатларни ифодалаш учун хизмат қилади;

4. Матнни таҳлил қилиш - матнлар автоматик олдиндан белгиланган тоифаларга

(таснифлаш) берилиши ёки шунга ўхшаш матнлар бирлаштирилиши учун гуруҳланиши
мумкин (сегментация);

5. Интерпретация ва натижаларни баҳолаш - матнни интеллектуал таҳлил қилиш

натижаларини интерпретациялаш ва баҳолаш;

6. Натижаларни қўллаш [6].
Маълумотларни олдиндан қайта ишлаш босқичидан олдин маълумотларни қайта

ишлаш усулларини батафсилроқ кўриб чиқиш кейинги босқичлар учун маълумотларни
қайта ишлаш босқичи қанчалик муҳимлигини тушунишга ёрдам беради.

Матнни интеллектуал таҳлил қилиш жараёни унинг грамматик ёки яширин

тузилишини ўрганишга қаратилган бўлиб, табиий тилни қайта ишлаш (масалан, тил
корпуслари билан ишлаш) технологияларини қамраб олади. Матнни қайта ишлашда
қўлланиладиган усуллар содда арифметик амаллардан то мураккаб нейрон тармоқларгача
кенгаяди [5] .

Матн таҳлил қилувчи воситалар уч тоифага ажратилади:
Хусусий матн таҳлил қилиш воситалари – бу компаниялар томонидан ишлаб чиқилган

ва фойдаланувчилар учун сотиб олишни талаб этиладиган воситалардир. Бунда одатда
чекланган демо версиялар тақдим этилади, бироқ тўлиқ версияси пуллик бўлади.

Очиқ кодли матн таҳлил қилиш воситалари бепул воситалар бўлиб, уларни

ривожлантиришда ҳамжамият томонидан қўшилиш ва уларга ўзгартиришлар киритиш
имкониятлари мавжуд.

Онлайн матнни таҳлил қилиш воситалари интернет хизматлар бўлиб, улар тўғридан-

тўғри веб-сайтлар орқали ишлатилади. Кўпинча, онлайн воситалар оддий функсияларни
тақдим этади ва чекланган имкониятларга эга бўлади.

Ўзбек тилидаги матнли маълумотларни таҳлил қилувчи иловалар жуда кам сонли

ҳисобланади. Бу масала юзасидан ҳозирда кўплаб илмий тадқиқотчилар томонидан
маълумотлар базаси йиғилиб, улар асосида ўзбек тили учун мукаммал ва хатоларсиз
ишловчи илова яратиш устида иш олиб борилмоқда. Ҳозирги кунда IT парк, илмий
тадқиқотчи ва тилшунос мутахассислар томонидан амалга оширилган лойиҳалар қуйидаги
жадвалда келтирилган.

1-жадвал

Тадқиқотчилар томонидан амалга оширилган лойиҳалар

Т/р

Номи

Асосий

функциялари

Ишлай

оладиган

Веб манзили


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

16

матн

ҳажми

1

Tahrirchi

Грамматик,

имло ва услубий

таҳрир

5,000

белгигача

(тахминан

700-800

сўз)

https://tilmoch.ai/ru/editor

2

Imlo

Имло

текшируви,

морфологик

таҳлил

10,000

белгигача

(12,000 тача

сўз)

https://imlo.uz/

3

Grammarly

Инглиз матнлар

таҳрири,

таржимада

ўзбекка

қўлланилиши

мумкин

100,000

белгигача,

аммо ўзбек

тилида

тўлиқ эмас

https://www.grammarly.com/

4

OpenAI

Стилистик

таҳрир,

грамматик

тузатиш, илмий

таҳлил

https://chatgpt.com/

5

UzbekCorpus

Корпус асосида

таҳлил ва луғат

излаш

2,000 тагача

белги (250

гача сўз)

https://uzbekcorpus.uz/

6

Uznatcorpara

Морфологик

таҳлил,

матнларга
дастлабки

ишлов бериш

2,000-3,000

тагача

белги

https://uznatcorpara.uz/uz/


Ушбу тадқиқотда ўзбек тилидаги матнларни дастлабки ишлов бериш ва таҳрир қилиш

учун мўлжалланган бир нечта платформалар солиштирилди. Tahrirchi ва Imlo матн имлоси
ҳамда грамматикани текшириш учун мос, OpenAI янада мураккаб стилистик таҳлил ва
тавсиялар бера олади. Uznatcorpara ва UzbekCorpus эса тилшунослик таҳлиллари учун анча
яхши натижаларни қайд этади. Платформалар орасида матн ҳажми бўйича ҳам фарқлар
мавжуд. Жумладан, Grammarly ва OpenAI катта ҳажмли матнлар билан ишлайди,
UznatCorpara ўртача ҳажмли матнлар учун қулай. Бунда ҳар бир платформанинг матн
ҳажмига нисбатан чегараси мавжуд. Матн ҳажмига ва мақсадга кўра исталган платформа
танланади ва таҳлил қилинади.

Хулоса.

Мавжуд платформалар ўзбек тилидаги матнларни таҳрирлаш ва таҳлил

қилишда маълум йўналишда самарали ишлайди. Услубий ва грамматик хатоликларни
бартараф этиш учун Tahrirchi, стилистик ва контекстли таҳлил учун OpenAI, тилшунослик
асосидаги ишловлар учун эса Uznatcorpara тавсия этилади. Матн ҳажми, функционал
қамрови ва мақсадга кўра ушбу воситалардан комбинацияланган ҳолда фойдаланиш
оптимал натижаларни таъминлаши мумкин деб ҳисоблаймиз.


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

17

Адабиётлар руйхати

[1] Ниёзматова, Н. А., Маматов, Н. С., Отахонова, Б. И., Бобоев, Л. Б., & Самижонов,

А. Н. Матнларни таснифлашда информатив белгилар мажмуасини аниқлаш усуллари.

[2] Babomuradov, O. O., Otaxonova, B., Mamatov, N. S., & Boboev, L. B. (2019). Text

documents classification in Uzbek language.

International journal of recent technology and

engineering

,

8

(2S11), 3787-3789.

[3] Д. М. Лосева, «Интеллектуальный анализ текстовых данных для решения задачи

категоризации информации».

[4] «Неструктурированные

данные:

примеры,

инструменты,

методики

и

рекомендации», Хабр. Просмотрено: 30 март 2025 г. [Онлайн]. Доступно на:
https://habr.com/ru/articles/756454/

[5] D. S. Vijayarani и J. Ilamathi, «Preprocessing Techniques for Text Mining - An

Overview», т. 5.

[6] Пальмов Сергей Вадимович и Мячина Анна Сергеевна, «Интеллектуальный анализ

текста», ноя. 2020, doi: 10.5281/ZENODO.4313358.

BOʻLAJAK BOSHLANGʻICH SINF OʻQITUVCHILARINING TANQIDIY
FIKRLASH QOBILIYATLARINI RIVOJLANTIRISHDA RAQAMLI

TEXNOLOGIYALARNING ROLI

Abdikarimova Fotima Baxromovna

Urganch davlat universiteti 3-bosqich tayanch doktoranti

fotims460@gmail.com

Annotatsiya:

Ushbu maqolada raqamli texnologiyalar bo‘lajak boshlang‘ich sinf

o‘qituvchilarining tanqidiy fikrlash qobiliyatlarini rivojlantirishda muhim rol o‘ynashini
ko‘rsatadi. Shuningdek, bu jarayonda yuzaga keladigan muammolarni bartaraf etish uchun
innovatsion ta’lim metodlarini qo‘llash zarurligi aytib o‘tiladi.

Kalit so‘zlar:

Tanqidiy fikrlash, raqamli texnologiyalar, interaktiv platformalar, ta’lim

dasturlari, pedagogik usullar, analitik fikrlash, onlayn kurslar, refleksiya, ma’lumotlar tahlili,
ta’lim metodologiyasi, axborot tahlili, onlayn platformalar, o‘quvchilarni o‘qitish, texnologik
savodxonlik, innovatsion ta’lim metodlari, raqamli vositalar.

РОЛЬ ЦИФРОВЫХ ТЕХНОЛОГИЙ В РАЗВИТИИ НАВЫКОВ

КРИТИЧЕСКОГО МЫШЛЕНИЯ У БУДУЩИХ УЧИТЕЛЕЙ НАЧАЛЬНЫХ

КЛАССОВ

Аннотация:

В этой статье показано, как цифровые технологии играют важную роль

в развитии навыков критического мышления у будущих учителей начальной школы. Также
упоминается необходимость применения инновационных методов обучения для
устранения проблем, возникающих в процессе.

Ключевые слова:

критическое мышление, цифровые технологии, интерактивные

платформы, образовательные программы, педагогические методы, аналитическое
мышление, онлайн-курсы, рефлексия, анализ данных, методология обучения, анализ
информации, онлайн-платформы, обучение учащихся, технологическая грамотность,
инновационные методы обучения, цифровые инструменты.

Bibliografik manbalar

Нисзматова, Н. А., Маматов, Н. С., Отахонова, Б. И., Бобосв, Л. Б., & Самижонов, А. Н. Матнларни таснифлашда информатив белгилар мажмуасини аниқлаш усуллари.

Babomuradov, О. О., Otaxonova, В., Mamatov, N. S., & Boboev, L. В. (2019). Text documents classification in Uzbek language. International journal of recent technology and engineering, <5(2S 11), 3787-3789.

Д. M. Лосева, «Интеллектуальный анализ текстовых данных для решения задачи категоризации информации».

«Неструктурированные данные: примеры, инструменты, методики и рекомендации», Хабр. Просмотрено: 30 март 2025 г. [Онлайн]. Доступно на: https://habr.com/ru/articlcs/756454/

D. S. Vijayarani и .1. Ilamathi, «Preprocessing Techniques for Text Mining - An Overview», t. 5.

Пальмов Сергей Вадимович и Мячина Анна Сергеевна, «Интеллектуальный анализ текста», ноя. 2020, doi: 10.5281/ZENODO.4313358.

Yuklashlar

Nashr qilingan

Qanday qilib iqtibos keltirish kerak

Ниёзматова, Н., Маматов, Н., Турғунова, Н., & Туракулова, Ш. (2025). Матнларни таҳлил қилиш иловалари . Современные проблемы интеллектуальных систем, 1(1), 14-17. https://inconference.uz/index.php/cpis/article/view/19

Nashr

Bo'lim

Статьи

Sahifalar

14-17

##stats.views##

0

##plugins.themes.default.displayStats.downloads##

0
##plugins.themes.default.displayStats.noStats##

Муаллифнинг (муаллифоарнинг) энг кўп ўқилган мақолалари

Tegishli maqolalar

Bundan tashqari, ushbu maqola uchun shunga o'xshash maqolalar uchun kengaytirilgan qidiruvni boshlang mumkin.