Нутқни қайта ишлашда коҳонен харитасини қўллаш ва уни самарадорлигини баҳолаш

Mualliflar

  • "Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
  • "Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
  • Наманган давлат университети

Annotasiya

Мазкур тадқиқотда нутқ сигналини шовкинлардан тозалаш учун Кохонсн харитасига асосланган янги сндашув таклиф этилган. Бунда нугқни частота ва энергия хусусиятлари асосида ва Коҳонен харитаси ёрдамида шовқинли кластерлар аниқланган ҳамда шовқин даражасини тахмин қилиш учун “Minimum Statistics Noise Estimation” усулидан фойдаланилган. Бу юқори шовқин даражаларида хам баркарор натижалар олишга имкон берган. Хусусият сифатида паст шовқин даражаларида MFCC, юқори шовқин даражаларида эса Log-Mel спектрограммасидан фойдаланилган. Тажрибалар турли шовкин даражаларида (1%, 5%, 10%, 15%, 20%, 25% ок шовкин) ўтказилиб, натижалар PESQ (Perceptual Evaluation of Speech Quality) метрикаси ёрдамида баҳоланган.

Kalit so‘zlar:

Коҳонен харитаси спектрал айириш MFCC Log-Mel спектрограммаси PESQ

Muallif tarjimai holi

Нилуфар Ниёзматова,
"Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
dotsenti
Куаныш Жалелов,
"Toshkent irrigatsiya va qishloq xo'jaligini mexanizatsiyalash muhandislari instituti" Milliy tadqiqot universiteti
ассистенти
Барно Абдуллаева,
Наманган давлат университети
таянч докторанти

background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

201

2-rasm.Erkin plyonka tizimidagi Si/ Cu ni energiyasi Yeo=1keV va ionlar dozasi D=6*10

16

sm

-2

bo‘lgan O

2

+

kislorod ionlari bilan implantatsiya qilingandan keyingi Si,Cu, va O atomlarining

taqsimlanish profili:1- Si, 2-O; 3-S.

Bu tizimni T=700-750 K qizdirib borilganda Si plyonkasi sirtida d ~1,5-2 nm qalinlikdagi

SiO

2

hosil bo‘lishiga olib keladi va o‘z navbatida to‘rt qatlamli SiO

2

/Si/Cu

2

Si

3

/Cu nanoplyonka

tizimi hosil bo‘ladi.

Xulosa.

Toza Si/Cu tizimini O

2

+

iolari bilan implantatsiya qilish va qizdirish yo‘li bilan d

~1,5-2 nm qalinlikdagi SiO

2

nanoplyonkasini olish imkonini berar ekan.Shundan keyin SiO

2

da

yetarli darajada Si(5-6 at.%)ning bog‘lanmagan atomlari vujudga kelib, bular SiO

2

dagi

taqiqlangan zona kengligini Eg ikki va undan ortiq barobar kamaytirar ekan.

Adabiyotlar ro‘yxati

1.

Landry O.,Bougerol

C.,Renevier H.,Daudin

B.//Nanotechnology.2009.Vol.20

N27.P/415602.

2. Wang D.,Zou Z.Q.// Nanotechnology.2009.Vol.20.N.27.P.275607.
3.

Domoshevskaya

E.P.Trexov

V.A.Turishev

S.Yu.va

boshqalar.Arrathurai

N.//FTT.2013.T.55.N

4. Muradkabilov D. M., Tashmuhammedova D.A., Umirzakov B.Y. Rabbimov E.A

//Poverxnost. Rentgen., sinxronotron. I neytron. Issledovaniya. 2013. № 10. S. 58-62. [
Muradkabilov D.M., Tashmukhamedova D.A., Umirzakov B.E. // J. Surf. Investigation: X-ray,
Synchotron and Neutron techniq. 2013. Vol.7. N. 5. September, P. 967-971.]

5. Umirzakov B.Y., Tashmuhammedova D.A., Ruzibaeva M.K., Tashatov A,K., Donaev

S.B., Mavliyanov B.B. // JTF. 2013. T. 83. Vыp. 9. S. 146-149. T [ Umirzakov B.E.
Tashmukhamedova D.A., Ruziboyeeva M.K., Tashatov A.K., Donaev S.B., Mavlyanov B.B //
techniq. Physics. 2013. Vol. 58. N. 9. P. 1383-1386

6. Sharopov U.B., Atabaev B.G., Djabbarganov R., Kurbanov M.K., // Poverxnost. Rentgen.,

sinxronotron. I neytron. Issledovaniya. 2016. № 2. S. 1-5.

НУТҚНИ ҚАЙТА ИШЛАШДА КОҲОНЕН ХАРИТАСИНИ ҚЎЛЛАШ ВА

УНИ САМАРАДОРЛИГИНИ БАҲОЛАШ

Ниёзматова Нилуфар Алохановна

“TIQXMMI” Milliy tadqiqot universiteti dotsenti

Жалелов Куаныш Моятдинович

“TIQXMMI” Milliy tadqiqot universiteti

ассистенти

Абдуллаева Барно Мўйдинжон қизи

Наманган давлат университети таянч докторанти

Аннотация:

Мазкур тадқиқотда нутқ сигналини шовқинлардан тозалаш учун

Коҳонен харитасига асосланган янги ёндашув таклиф этилган. Бунда нутқни частота ва
энергия хусусиятлари асосида ва Коҳонен харитаси ёрдамида шовқинли кластерлар
аниқланган ҳамда шовқин даражасини тахмин қилиш учун “Minimum Statistics Noise
Estimation” усулидан фойдаланилган. Бу юқори шовқин даражаларида ҳам барқарор
натижалар олишга имкон берган. Хусусият сифатида паст шовқин даражаларида MFCC,
юқори шовқин даражаларида эса Log-Mel спектрограммасидан фойдаланилган.
Тажрибалар турли шовқин даражаларида (1%, 5%, 10%, 15%, 20%, 25% оқ шовқин)


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

202

ўтказилиб, натижалар PESQ (Perceptual Evaluation of Speech Quality) метрикаси ёрдамида
баҳоланган.

Калит сўзлар

: Коҳонен харитаси, спектрал айириш, MFCC, Log-Mel

спектрограммаси, PESQ.

ПРИМЕНЕНИЕ КАРТЫ КОХОНЕНА В ОБРАБОТКЕ РЕЧИ И ОЦЕНКА ЕЁ

ЭФФЕКТИВНОСТИ

Аннотация:

В данном исследовании предложен новый подход на основе карты

Кохонена для очистки речевого сигнала от шумов. В этом методе шумовые кластеры
определялись с использованием карты Кохонена на основе частотных и энергетических
характеристик речи, а для оценки уровня шума применялся метод «Minimum Statistics Noise
Estimation». Это позволило добиться стабильных результатов даже при высоких уровнях
шума. В качестве признаков использовались MFCC при низком уровне шума и
логарифмическая мел-спектрограмма (Log-Mel) при высоком уровне шума. Эксперименты
проводились при различных уровнях шума (1%, 5%, 10%, 15%, 20%, 25% белого шума), а
результаты оценивались с помощью метрики PESQ (Perceptual Evaluation of Speech Quality).

Ключевые

слова:

карта

Кохонена,

спектральное

разделение,

MFCC,

логарифмическая мел-спектрограмма, PESQ.

APPLICATION OF THE KOHONEN MAP IN SPEECH PROCESSING AND ITS

EFFICIENCY EVALUATION

Abstract:

This study proposes a novel approach based on the Kohonen map for denoising

speech signals. In this method, noisy clusters were identified using the Kohonen map based on
speech frequency and energy characteristics, while the "Minimum Statistics Noise Estimation"
method was used to estimate the noise level. This approach allowed for stable results even at high
noise levels. As features, MFCC was used for low noise levels, while the Log-Mel spectrogram
was employed for high noise levels. Experiments were conducted at various noise levels (1%, 5%,
10%, 15%, 20%, 25% white noise), and the results were evaluated using the PESQ (Perceptual
Evaluation of Speech Quality) metric. The proposed approach demonstrated that combining an
energy-based criterion with frequency characteristics for identifying noisy clusters significantly
improves speech quality.

Keywords:

Kohonen map, spectral separation, MFCC, Log-Mel spectrogram, PESQ.

Кириш

. Замонавий технологиялар ривожланиши билан нутқни қайта ишлаш соҳаси

тобора муҳим аҳамият касб этмоқда [1]. Телефон суҳбатлари, овозли ёрдамчилар ва
автоматик нутқни таниб олиш тизимлари каби иловалар шовқинли муҳитда юқори сифатли
нутққа бўлган эҳтиёжни оширмоқда. Бироқ, реал ҳаёт шароитларида, масалан, кўча
шовқини ёки жамоат жойларидаги фон шовқинлари нутқ сигнали аниқлигига жиддий
таъсир кўрсатади. Шу сабабли, нутқдан шовқинни самарали йўқотиш ва сифатни ошириш
бўйича янги усуллар ишлаб чиқиш долзарб вазифага айланмоқда.

Ҳозирги кунда нутқни қайта ишлашда шовқинни пасайтириш учун турли усуллар,

жумладан, спектрал айириш, вейвлет алмаштириш ва чуқур ўқитишга асосланган
ёндашувлар кенг қўлланилмоқда [3,4]. Ушбу усуллар ўзига хос афзалликларга эга бўлса-да,
уларни ҳар бири маълум чекловларга эга. Хусусан, спектрал айириш мусиқий шовқинларни
келтириб чиқариши мумкин, чуқур ўқитиш эса катта ҳажмдаги маълумотлар ва ҳисоблаш
ресурсларини талаб қилади [5-7]. Шу нуқтаи назардан, Коҳонен харитаси каби ўз-ўзини
ташкил қилувчи нейрон тармоқлар шовқинни йўқотишда муқобил ёндашув сифатида


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

203

эътиборга лойиқ. Коҳонен харитаси кириш маълумотларини кластерлаш ва шовқинли
компонентларни ажратиш қобилиятига эга, бу уни нутқ сигналини қайта ишлашда қўллаш
имконини

беради [8,9].

Мазкур тадқиқотда шовқинли кластерларни аниқлаш учун Коҳонен харитаси,

шовқинни тахмин қилиш учун эса Minimum Statistics Noise Estimation усули
фойдаланилган. Таклиф этилган ёндашув TIMIT маълумотлар базасининг тоза нутқ
намуналарида синовлардан ўтказилган. Ушбу маълумотлар 16 kHz частотада ёзиб олинган
бўлиб, ҳар бир аудио файл давомийлиги ўртача 3-5 сонияни ташкил этган. Бунда қуйидаги
муҳим белгиланишлар киритилган:

 

s t

- тоза нутқ сигнали (16 kHz),

     

x t

s t

n t

бу шовқинли сигнал,

 

n t

оқ шовқин.

Кохонен харитасида хусусиятлар шовқин даражасига қараб танланган. Паст шовқин

даражаларида (SNR ≥ 5) MFCC хусусиятлари қўлланилган, чунки улар паст шовқинли
муҳитда нутқни яхши ифодалайди. Юқори шовқин даражаларида (SNR < 5) эса Log-Mel
спектрограммасидан фойдаланилган.

Шовқинли кластерларни аниқлаш учун Кохонен хартиасини қўллаш қуйидагича

амалга оширилган:

 

 

 

, *

1

( )

j

j

j j

j

w t

w t

t h

t

x

w t

 

бу ерда,

 

t

- ўқитиш тезлиги,

 

j

w t

— нейрон оғирлик вектори,

x

— кириш

вектори,

 

, *

j j

h

t

— Гауссиан қўшнилик функцияси.

Таклиф этилган ёндашув самарадорлиги PESQ метрикаси ёрдамида баҳоланган

бўлиб, уни қийматлар оралиғи

PESQ

0.5,4.5

 

ни ташкил этади.

Тадқиқотда нутқ сигналини шовқиндан тозалаш учун Вейвлет алмаштириш, спектрал

айириш ва Кохонен харитаси каби ёндашувлари турли шовқин даражаларида (1%, 5%, 10%,
15%, 20%, 25% оқ шовқин) синовлардан ўтказилган ҳамда уларни қўллаш натижасидаги
PESQ қийматлари қуйидаги жадвалда келтирилган.

1-жадвал. Шовқин тозалаш усулларини қўллаш натижасидаги PESQ қийматлари

Шовқин

даражаси

(%)

Шовқинли

нутқ

   

,

PESQ s t x t

Вейвлет

алмаштириш

 

 

,

wave

PESQ s t x

t

Спектрал

айириш

 

 

,

specsub

PESQ s t

x

t

Кохонен

харитаси

 

 

,

SOM

PESQ s t x

t

1

1.484

1.693

1.605

2.412

5

1.066

1.157

1.080

1.588

10

1.040

1.091

1.050

1.301

15

1.033

1.064

1.037

1.168

20

1.030

1.046

1.033

1.104

25

1.030

1.039

1.031

1.078

Юқоридаги жадвалдан Кохонен харитаси ёрдамида тозаланган сигналларни PESQ

қийматлари бошқа усулларга нисбатан сезиларли даражада юқори эканлигини кўриш
мумкин.

Хулоса.

Мазкур тадқиқотда Коҳонен харитаси ёрдамида нутқ сигналини шовқиндан

тозалаш масаласи тадқиқ этилди. Бунда Кохонен харитаси шовқинли кластерларни
аниқлаш учун фойдаланилди. Шунингдек, энергияга асосланган мезон частота


background image

Современные проблемы интеллектуальных систем. Республиканская научно-практическая конференция. Джизак, 18-19 апреля 2025 г.

204

хусусиятлари билан бирлаштирилди, бу нутқ ва шовқинни фарқлаш сифатини оширди.
Тадқиқотда ўказилган натижалар асосида қуйидаги хулосалар шаклланди:

Паст шовқин даражасида (1%) Кохонен харитасини натижаси шовқинли сигналга

нисбатан 1.484 дан 2.412 га ошди, бу уни шовқинни самарали камайтирганини кўрсатади.

Шовқин даражаси ошгани сари (5% дан 25% гача) Кохонен харитасини PESQ

қийматлари 1.588 дан 1.078 гача пасайди, лекин ҳар бир ҳолатда шовқинли сигналга
нисбатан сезиларли яхшиланиш кузатилди.

Юқори шовқин даражаларида (15% дан 25% гача) Кохонен харитаси бошқа

усулларга нисбатан барқарор натижалар кўрсатди (масалан, 25% шовқин учун 1.078).

Aдабиётлар рўйхати

1. Niyozmatova, N. A., Mamatov, N. S., Dusonov, X. T., Samijonov, B. N., & Samijonov,

A. N. MFCC-GMM Method for Speaker Identification by Voice.

2. Niyozmatova, N. A., Mamatov, N. S., Samijonov, A. N., & Samijonov, B. N. (2025).

Language and acoustic modeling in Uzbek speech recognition. In

Artificial Intelligence and

Information Technologies

(pp. 558-564). CRC Press.

3. Shambhu Shankar Bharti & others “A New Spectral Subtraction Method for Speech

Enhancement using Adaptive Noise Estimation” 3rd Int’l Conf. on Recent Advances in
Information Technology, 2016.

4. Hilman Pardede, Kalamullah Ramliand others “Speech Enhancement for Secure

Communication Using Coupled Spectral Subtraction and Wiener Filter”, University of Indonesia,
Jawa Barat -14-August, 2019.

5. M. Kolbak, Z.-H. Tan, and J. Jensen, “Speech intelligibility potential of general and

specialized deep neural network-based speech enhancement systems” IEEE/ACM Transactions on
Audio, Speech, and Language Processing, vol. 25, no. 1, pp. 153–167, 2017.

6. Y. Xu, J. Du, L.-R. Dai, and C.-H. Lee, “A regression approach to speech enhancement

based on deep neural networks,” IEEE/ACM Transactions on Audio, Speech and Language
Processing (TASLP), vol. 23, no. 1, pp. 7–19, 2015.

7. K. Kinoshita, M. Delcroix, H. Kwon, T. Mori, and T. Nakatani, “Neural network-based

spectrum estimation for online WPE dereverberation,” in Interspeech, 2017, pp. 384–388.

8. J. C. Wiemer, “The Time-Organized Map algorithm: Extending the Self-Organizing Map

to spatiotemporal signals”, Neural Computation, vol. 15, no. 5, 2003, pp. 1143-1171.

9. G. de A. Barreto and A. F. R. Araújo, “Time in self-organizing maps: An overview of

models”, International Journal of Computer Research, vol. 10, n 02, 2001, pp. 139-179.

DERMOSKOPIK TASVIRLARNI QAYTA ISHLASHDA KATTA

MA’LUMOTLAR TAHLILINING MUAMMOLARI VA YECHIMLARI

Gulmirzaeva Go‘zal Alisher qizi

Toshkent axborot texnologiyalari universiteti tayanch doktoranti

gozzalgulmirzayeva55@gmail.com

Rajabov Jamshid Akbarali o‘g‘li

Berdaq nomidagi Qoraqalpoq davlat universiteti magistranti

rajabovjamshid2106@gmail.com

Annotatsiya:

Sog‘liqni saqlashda raqamlashtirish jarayoni dermoskopik tasvirlarni

avtomatlashtirilgan tahlil qilishni talab etmoqda. Bunday tasvirlar teri shishlarini, xususan

Bibliografik manbalar

Niyozmatova, N. A., Mamatov, N. S., Dusonov, X. T., Samijonov, B. N., & Samijonov, A. N. MFCC-GMM Method for Speaker Identification by Voice.

Niyozmatova, N. A., Mamatov, N. S., Samijonov, A. N., & Samijonov, B. N. (2025). Language and acoustic modeling in Uzbek speech recognition. In Artificial Intelligence and Information Technologies (pp. 558-564). CRC Press.

Shambhu Shankar Bharti & others “A New Spectral Subtraction Method for Speech Enhancement using Adaptive Noise Estimation” 3rd Int’l Conf, on Recent Advances in Information Technology, 2016.

Hilman Pardede, Kalamullah Ramliand others “Speech Enhancement for Secure Communication Using Coupled Spectral Subtraction and Wiener Filter”, University of Indonesia, Jawa Barat -14-August, 2019.

M. Kolbak, Z.-H. Tan, and J. Jensen, “Speech intelligibility potential of general and specialized deep neural network-based speech enhancement systems” IEEE/АСМ Transactions on Audio, Speech, and Language Processing, vol. 25, no. 1. pp. 153-167, 2017.

Y. Xu, J. Du, L.-R. Dai, and С.-FI. Lee, “A regression approach to speech enhancement based on deep neural networks,” IEEE/АСМ Transactions on Audio, Speech and Language Processing (TASLP), vol. 23, no. 1, pp. 7-19, 2015.

K. Kinoshita, M. Delcroix, H. Kwon, T. Mori, and T. Nakatani, “Neural network-based spectrum estimation for online WPE dereverberation,” in Interspeech, 2017, pp. 384-388.

.1. C. Wicmer, “The Time-Organized Map algorithm: Extending the Self-Organizing Map to spatiotemporal signals”, Neural Computation, vol. 15, no. 5, 2003, pp. 1143-1171.

G. de A. Barreto and A. F. R. Araujo, “Time in self-organizing maps: An overview of models”, International Journal of Computer Research, vol. 10, n 02, 2001, pp. 139-179.

Yuklashlar

Nashr qilingan

Qanday qilib iqtibos keltirish kerak

Ниёзматова, Н., Жалелов, К., & Абдуллаева, Б. (2025). Нутқни қайта ишлашда коҳонен харитасини қўллаш ва уни самарадорлигини баҳолаш . Современные проблемы интеллектуальных систем, 1(1), 201-204. https://inconference.uz/index.php/cpis/article/view/57

Nashr

Bo'lim

Статьи

Sahifalar

201-204

##stats.views##

0

##plugins.themes.default.displayStats.downloads##

0
##plugins.themes.default.displayStats.noStats##

Муаллифнинг (муаллифоарнинг) энг кўп ўқилган мақолалари