Cebirsel Düşünme Becerisinin Gelişimindeki Yaklaşımlar

2. KURAMSAL ÇERÇEVE

2.8. Cebirsel Düşünme Becerisinin Gelişimindeki Yaklaşımlar

Nesta se¸c˜ao, fazemos uma compara¸c˜ao do m´etodo SoftSoft com outros m´etodos de redu¸c˜ao de ru´ıdo que utilizam apenas o sinal de entrada (ruidoso) e que n˜ao con- sideram um modelo para a produ¸c˜ao da voz ou para a percep¸c˜ao do sistema auditivo humano. Mais especificamente, para efeito de compara¸c˜ao, foram selecionados os melhores resultados experimentais obtidos por Filgueiras em [5].

4.3.1 Experimento 1: Frase 1, masculina, 10 dB.

A grava¸c˜ao da Frase 1 com voz masculina possui dura¸c˜ao de 2.8085 s, o que corresponde ao comprimento de 22468 amostras. Como utilizamos processamento em blocos, o comprimento N deve ser m´ultiplo do comprimento L = 128 de cada bloco. Por isso, consideramos sinal original com N = 128_{× 176 = 22528 amostras,} sendo as amostras excedentes completadas com zeros. O sinal de entrada (ruidoso, com SN R = 10 dB, cf. Tabela 4.3) ´e obtido adicionando ru´ıdo (AWGN) ao sinal original.

Na Tabela 4.3a, s˜ao reproduzidos os resultados obtidos em [5], utilizando a trans- formada Wavelet de Vaidyanatham. Observamos que, nesta referˆencia, o c´alculo das medidas de desempenho desconsidera o ´ultimo bloco (que foi completado com zeros). Por este motivo, usamos comprimento de 128_{× 175 = 22400 no c´alculo das medi-} das apresentadas na tabela. Tamb´em esclarecemos que a SegSN R e LSD da tabela foram calculadas usando bloco de 128 amostras. Finalmente, uma ´ultima providˆencia que tomamos para reproduzir as condi¸c˜oes experimentais da referˆencia, possibilitan- do a compara¸c˜ao dos resultados, foi utilizar a mesma implementa¸c˜ao computacional no c´alculo da SegSN R e LSD. Mais especificamente, a divis˜ao por zero ou o log de zero em (4.2) e (4.3) s˜ao evitados pela adi¸c˜ao de um n´umero pequeno (10−100_{) aos}

valores envolvidos.

Na Tabela 4.3b, consideramos:

— O m´etodo Soft com limiar calculado de maneira direta (que denotamos por SoftD_{) usando como informa¸c˜ao o sinal original (ou o ru´ıdo adicionado);}

SNR (dB) SegSNR(dB) LSD(dB)

Sinal Ruidoso de Entrada: 10.00 3.39 6.73 ⊲

a) RiskShrink: 10.26 5.45 5.37 SUREShrink: 9.70 3.73 6.07 MMSEWC: 12.18 6.45 5.95 MMSEWC-2: 12.71 6.42 5.19 Filtro de Wiener: 13.64 8.11 5.95 b) SoftD_{, ¯}_{t = 0.0096:} _12.62 _6.48 _11.5 _⊲ SoftSoftD, ˇt1 = 0.1256, ¯t2 = 0.0112: 12.67 6.53 5.41 ⊲ SoftSoftP_{, ˇ}_t 1 = 0.2060, ¯t2 = 0.0133: 12.62 6.50 5.29 ⊲ HardHard, ˇt1 = 0.1, ¯t2 = 0.03: 11.38 6.02 21.6 ⊲

Tabela 4.3: Experimento 1. Entrada: Frase 1, voz masculina e SN R = 10 dB. Resultados: a) Obtidos por Filgueiras em [5]; b) Obtidos pelos m´etodos de threshold. — O m´etodo SoftSoft com limiares calculados de maneira direta (SoftSoftD_{) e}

estimados pelo m´etodo pr´atico (SoftSoftP_);

— O m´etodo HardHard.

Deve-se esclarecer que para o m´etodo HardHard, houve uma certa dificuldade para escolher limiares, pois a fun¸c˜ao GCV n˜ao se aplica ao threshold Hard. Ainda, no caso HardHard, a superf´ıcie do MSEE em fun¸c˜ao do par (t1,t2) n˜ao apresenta ponto de

m´ınimo para t1 6= 0. Mesmo usando or´aculo [1] para sele¸c˜ao dos coeficientes, n˜ao

se verifica ponto de m´ınimo para t1 6= 0. J´a a superf´ıcie de atenua¸c˜ao relativa3

em fun¸c˜ao de (t1,t2), usando or´aculo para sele¸c˜ao dos coeficientes, apresenta um

m´ınimo em ˇt1 = 0.1 e ¯t2 = 0.03. Por outro lado, usando os coeficientes ruidosos na

classifica¸c˜ao dos coeficientes, obtˆem-se um ponto de m´ınimo em ˇt1 = 0.02 e ¯t2 = 0.03.

Como um valor de t1 mais elevado diminui o ru´ıdo musical, escolheu-se o primeiro

ponto de m´ınimo para a simula¸c˜ao apresentada na Tabela 4.3b. 3

Inicialmente, pensamos em utilizar uma medida alternativa para determinar a qualidade da estima¸c˜ao. Definimos a atenua¸c˜ao relativa como a diferen¸ca entre a energia do sinal original menos a energia do ru´ıdo, ap´os a aplica¸c˜ao do mesmo threshold, separadamente, a cada um dos componentes: Arel(t) =||st||

− E ||wt|| 2

. Curiosamente, nesta superf´ıcie, a fun¸c˜ao SoftSoft n˜ao apresenta ponto de m´ınimo com t16= 0.

Quanto `a qualidade perceptual do sinal de sa´ıda, Filgueiras comenta em [5] que o sinal obtido pelo estimador MMSEWC-2 (Minimum Mean-Square Error Wavelet Coefficient Estimator 2 ) soa menos ruidoso e menos distorcido do que o sinal pro- duzido pelos outros m´etodos desta referˆencia. Por exemplo, os sinais gerados pelos m´etodos SUREShrink e RiskShrink [24] possuem alguns artefatos que soam como um ru´ıdo impulsivo bem localizado no tempo semelhante ao ru´ıdo musical dos algoritmos subtrativos. J´a os m´etodos MMSEWC e MMSEWC-2 produzem este tipo de ru´ıdo em menor propor¸c˜ao e, al´em do mais, o ru´ıdo de fundo na sa´ıda ´e quase branco. Filgueiras comenta, ainda, que os algoritmos subtrativos levam a melhores SN R e SegSN R de sa´ıda, por´em a LSD piores, significando que, de uma maneira geral, estes possuem menos ru´ıdo na sa´ıda, mas uma distor¸c˜ao maior.

Em contrapartida, o m´etodo SoftSoftP _{n˜ao produziu ru´ıdo musical, sendo, ainda,}

o ru´ıdo de fundo percebido como sendo branco e a distor¸c˜ao da voz, impercept´ıvel. J´a o m´etodo HardHard apresentou um elevado ru´ıdo musical, comprovando a inutilidade deste m´etodo para a redu¸c˜ao de ru´ıdo em sinais de voz.

Embora nosso problema n˜ao seja minimizar a LSD, julgamos oportuno fazer al- gumas considera¸c˜oes acerca desta medida de distor¸c˜ao. Para isso, na Figura 4.3, apresentamos a superf´ıcie LSD em fun¸c˜ao dos limiares (SoftSoft), a qual foi calculada utilizando o sinal original, suposto conhecido, juntamente com o sinal de entrada da Tabela 4.3. Pode-se observar na figura que o ponto de m´ınimo LSD, (4), n˜ao coincide com o ponto de m´ınimo MSEE, (1). Ainda, nota-se que o ponto (3) estimado pelo m´etodo SoftSoftP_{apresenta menor LSD do que o ponto (1). Por fim, tamb´em se pode}

constatar que o LSD aumenta rapidamente com a diminui¸c˜ao do limiar inferior, su- gerindo que o m´etodo SoftSoft (com t1 6= 0) produz melhores resultados perceptuais

do que o m´etodo Soft. De fato, neste experimento, o m´etodo SoftD _{apresentou uma}

Figura 4.3: Curvas de n´ıvel da LSD em fun¸c˜ao do par de limiares SoftSoft. Indicados os pontos: (1) de m´ınimo MSEE para threshold SoftSoft; (2) de m´ınimo MSEE para threshold Soft, i.e., para t1 = 0; (3) ponto m´ınimo MSEE estimado usando o “M´etodo

Pr´atico”; e (4) ponto de m´ınimo LSD.⊲ _{(Mesmas condi¸c˜oes experimentais da Tabela}

4.3.2 Experimento 2: Frase 1, feminina, 10 dB.

Repetimos o experimento anterior para uma voz feminina com a finalidade de verificar se uma voz com conte´udo de freq¨uˆencias mais elevadas produz resultados semelhantes.

Os resultados de Filgueiras [5] s˜ao reproduzidos na Tabela 4.4a.

Novamente, reproduzimos as mesmas condi¸c˜oes experimentais da referˆencia e ob- tivemos os resultados da Tabela 4.4b.

O sinal de entrada da tabela possui uma SegSN R menor do que aquela observada no experimento anterior, possivelmente devido a existˆencia de um maior n´umero de blocos sem atividade de fala na grava¸c˜ao com a voz feminina. Apesar desta diferen¸ca nas condi¸c˜oes experimentais, pode-se observar na Tabela 4.4 que o desempenho re- lativo dos m´etodos ´e semelhante `aquele observado com a voz masculina, cf. Tabela 4.3.

SNR(dB) SegSNR(dB) LSD (dB)

Sinal Ruidoso de Entrada: 10.00 0.93 7.53 ⊲

a) RiskShrink: 11.09 4.81 5.99

SUREShrink: 9.10 3.32 5.55

MMSEWC, proc. em blocos: 13.95 6.31 5.54

MMSEWC-2, bco. de filtros: 13.47 5.38 4.99

Filtro de Wiener: 15.68 8.16 5.95 b) SoftD_{, ¯}_{t = 0.0104:} _12.97 _4.49 _12.55 _⊲ SoftSoftD_{, ˇ}_t 1 = 0.0955, ¯t2 = 0.0146: 13.13 5.00 5.44 ⊲ SoftSoftP_{, ˇ}_t 1 = 0.2010, ¯t2 = 0.0149: 13.05 4.66 5.60 ⊲

Tabela 4.4: Experimento 2. Entrada: Frase 1, voz feminina e SN R = 10 dB. Resul- tados: a) Obtidos por Filgueiras em [5]; b) Obtidos pelos m´etodos de threshold.

4.3.3 Experimento 3: Frase 2, masculina, 3 dB.

Neste experimento foi considerado um n´ıvel mais elevado de ru´ıdo e, ainda, foi escolhido para compara¸c˜ao o melhor resultado de Filgueiras [5], reproduzidos na Tabela 4.5a. Tamb´em aproveitamos a oportunidade para empregar uma frase dife- rente daquela utilizada nos experimentos anteriores.

Reproduzimos as condi¸c˜oes experimentais da referˆencia [5] e obtivemos os resulta- dos da Tabela 4.5b. Em virtude do maior n´ıvel de ru´ıdo, o m´etodo SoftSoft resultou em um pouco de ru´ıdo musical no sinal de sa´ıda. Contudo, devemos ressaltar que o ru´ıdo musical ´e muito maior no m´etodo convencional (Soft), conforme evidenciado pela grande LSD obtida com este m´etodo, indicado na Tabela 4.5b.

SNR(dB) SegSNR(dB) LSD(dB)

Sinal Ruidoso de Entrada: 3.01 −4.67 8.54 ⊲

a) MMSEWC-2, bco. de filtros: 7.07 0.89 5.46

b) SoftD_{, ¯}_{t = 0.0392:} _7.06 _0.20 _17.3 _⊲

SoftSoftD_{, ˇ}_t

1 = 0.0905, ¯t2 = 0.0444: 7.14 0.27 6.07 ⊲

SoftSoftP_{, ˇ}_t

1 = 0.1859, ¯t2 = 0.0517: 7.00 −0.05 6.20 ⊲

Tabela 4.5: Experimento 2. Entrada: Frase 2, voz masculina e SN R = 3 dB. Resultados: a) Obtido por Filgueiras em [5]; b) Obtidos pelos m´etodos de threshold.

4.3.4 Experimento 4: Frase 2, masculina, 0 dB.

Neste experimento, consideramos um n´ıvel de ru´ıdo ainda mais elevado, conforme se pode constatar pela baixa SegSN R do sinal de entrada considerado na Tabela 4.6. Nestas condi¸c˜oes, o melhor resultado da referˆencia [5] ´e reproduzido na Tabela 4.6a. Os m´etodos de threshold deste trabalho, empregando a mesma entrada, produzem os resultados da Tabela 4.6b.

Conforme observado por Filgueiras em [5], os sinais de sa´ıda produzidos pelo esti- mador MMSEWC-2 apresentam alguns clicks que n˜ao comprometem a inteligibilidade da frase. Deve-se ressaltar que em todos os experimentos realizados, n˜ao observamos

SNR(dB) SegSNR(dB) LSD(dB)

Sinal Ruidoso de Entrada: 0 _−7.67 9.66 ⊲

a) MMSEWC-2: 4.81 0.43 5.78 b) SoftD_{, ¯}_{t = 0.0642:} _5.19 _−1.36 _21.7 _⊲ SoftSoftD_{, ˇ}_t 1 = 0.0653, ¯t2 = 0.0698: 5.27 −1.33 6.39 ⊲ SoftSoftP_{, ˇ}_t 1 = 0.1709, ¯t2 = 0.0806: 4.99 −2.03 6.83 ⊲

Tabela 4.6: Experimento 2. Entrada: Frase 2, voz masculina e SN R = 0 dB. Resultados: a) Obtido por Filgueiras em [5]; b) Obtidos pelos m´etodos de threshold. estes clicks quando utilizamos o m´etodo SoftSoft. Tal fato se deve, possivelmente, `a existˆencia de um grande n´umero de coeficientes n˜ao eliminados pela fun¸c˜ao SoftSoft em cada um dos blocos do sinal reconstru´ıdo.

Por outro lado, o sinal de sa´ıda produzido pelo m´etodo SoftSoftP _{(que ´e o m´etodo}

de threshold com menor LSD na tabela) cont´em grande quantidade de ru´ıdo musical, sendo estes esp´urios igualmente observados nos demais m´etodos da tabela, inclusive no m´etodo MMSEWC-2 e, em especial, no m´etodo SoftD_{que apresenta a maior LSD}

4.4 Conclus˜ao

Os ensaios computacionais realizados demonstraram que ´e poss´ıvel obter, com o m´etodo SoftSoft, n˜ao somente uma maior redu¸c˜ao do MSEE, mas tamb´em uma melhor qualidade do sinal estimado, isto em compara¸c˜ao com os m´etodos de threshold convencionais.

De fato, na Se¸c˜ao 4.2, constatamos por meio de um experimento simples que estes ´ultimos n˜ao conseguem preservar caracter´ısticas importantes do sinal de voz, produzindo um sinal estimado com muita distor¸c˜ao e esp´urios na forma de ru´ıdo musical.

Por ´ultimo, na Se¸c˜ao 4.3, oferecemos uma compara¸c˜ao de desempenho entre o m´etodo SoftSoft e outros m´etodos de redu¸c˜ao de ru´ıdo em condi¸c˜oes equivalentes, concluindo-se que aquele tem um desempenho compar´avel aos melhores resultados encontrados nestes ´ultimos. Al´em do mais, os experimentos desta se¸c˜ao indicaram que o m´etodo pr´atico, SoftSoftP_{, obtido no cap´ıtulo anterior, fornece uma estimativa}

razo´avel para os valores dos limiares, podendo ser utilizado em situa¸c˜oes pr´aticas que exijam uma forma simples e r´apida de obtˆe-los.

Cap´ıtulo 5

Considera¸c˜oes Finais

Inicialmente, no Cap´ıtulo 2, definimos o problema gen´erico de redu¸c˜ao de ru´ıdo e apreciamos v´arios m´etodos dispon´ıveis na literatura que utilizam como informa¸c˜ao apenas o sinal de entrada, obtido por um ´unico microfone, que sup˜oem AWGN e que aproveitam poucos aspectos f´ısicos do sistema vocal e auditivo humano.

Em seguida, o m´etodo SoftSoft, desenvolvido no Cap´ıtulo 3, alcan¸cou uma redu¸c˜ao de ru´ıdo compar´avel aos melhores resultados apresentados em um outro trabalho que trata do mesmo assunto, [5], conforme foi poss´ıvel se constatar no Cap´ıtulo 4. Al´em do mais, ainda neste cap´ıtulo, verificamos outra vantagem do m´etodo proposto: o erro quadr´atico m´edio do m´etodo SoftSoft ´e menor do que aquele produzido pelos m´etodos de threshold convencionais.

Devemos salientar que, embora aquela redu¸c˜ao do MSEE n˜ao seja numericamente expressiva, a maior qualidade perceptual obtida com m´etodo SoftSoft, por si s´o, j´a justifica a aplica¸c˜ao deste na redu¸c˜ao de ru´ıdo em sinais de voz. Ou melhor, n˜ao se deve levar em conta apenas uma medida matem´atica de erro, como o erro quadr´atico m´edio, mas tamb´em aspectos psico-ac´usticos da percep¸c˜ao auditiva humana, uma vez que o objetivo final ´e se obter uma melhoria do sinal ruidoso, sendo esta melhoria avaliada por um ouvinte.

A princ´ıpio, consideramos apenas o caso de ru´ıdo estacion´ario. A aplica¸c˜ao do m´etodo proposto para o caso de ru´ıdo n˜ao-estacion´ario pode ser investigada pela utiliza¸c˜ao de valores de limiares calculados a cada grupo de blocos do sinal de entrada.

Desta forma, os limiares se adaptar˜ao `as caracter´ısticas do sinal e do ru´ıdo a cada trecho analisado. Mais especificamente, pensamos em dividir o sinal de entrada (frase completa com alguns segundos de dura¸c˜ao) em trechos de N amostras (intervalos de tempo com alguns d´ecimos de segundo), sendo cada trecho sub-dividido em blocos com L amostras (intervalos da ordem de 20 ms). Em seguida, aplicamos o m´etodo de redu¸c˜ao de ru´ıdo a cada trecho. Os trechos podem ser multiplicados por uma janela e processados com sobreposi¸c˜ao a fim de amenizar eventuais altera¸c˜oes bruscas no sinal de sa´ıda provocadas pela varia¸c˜ao nos valores dos limiares.

Tamb´em seria interessante estudar o desempenho do m´etodo quando aplicado na redu¸c˜ao de ru´ıdo em sinais de voz de banda larga, i.e., com largura de banda de 7 kHz (taxa de amostragem de 14000 a 16000 amostras/s) usado em algumas aplica¸c˜oes de teleconferˆencia ou, at´e mesmo, com largura de banda de 22.05 kHz empregada nas grava¸c˜oes de ´audio digital (Compact Discs).

Finalmente, esperamos que este trabalho tenha contribu´ıdo com um novo m´etodo de redu¸c˜ao de ru´ıdo e que as novas fun¸c˜oes de threshold incentivem a busca por solu¸c˜oes an´alogas em outras aplica¸c˜oes.

Bibliografia

[1] S. MALLAT, “A Wavelet Tour of Signal Processing”, Academic Press, 2nd edi- tion, 1999.

[2] MAARTEN JENSEN, “Noise Reduction by Wavelet Thresholding”, Lecture Notes in Statistics, vol. 161, Springer-Verlag, 2001.

[3] ANTHONY TEOLIS, “Computational signal processing with wavelets”, Ed. Birkh¨auser, 1968.

[4] D. L. DONOHO, and I. M. JOHNSTONE, “Ideal spatial adaptation via wavelet shrinkage”, Biometrika, vol. 1, pp. 425-455, 1992.

[5] THOMAS EDSON F. FILHO, “Melhoria da Qualidade de Sinais de Voz Uti- lizando Transformadas Wavelets”, Disserta¸c˜ao (Mestrado), Escola Polit´ecnica da Universidade de S˜ao Paulo. Departamento de Telecomunica¸c˜oes e Controle. 2003.

[6] Y. EPHRAIM and D. MALAH, “Speech enhancement using a minimum mean- square error log-spectral amplitude estimator”, IEEE Transactions on Acoustics, Speech and Signal Processing, ASSP-33(2):443445, Apr. 1985.

[7] GILLIAN M. DAVIS, “Noise Reduction in Speech Applications”, Ed. CRC Press, 2002.

[8] P. S. K. HANSEN, “Signal Subspace Methods for Speech Enhancement”, PhD thesis, Technical University of Denmark, Lyngby, Denmark, Sep. 1997.

[9] J. S. LIM, A. V. OPPENHEIM, “Enhancement and Bandwidth Compression of Noisy Speech”, Proc. IEEE, vol. 67, No. 2, pp. 1586-1604, Dec. 1979.

[10] HENRIQUE S. MALVAR, “Signal Processing with Lapped Transforms”, Artech House, Inc., 1992.

[11] C. S. BURRUS, RAMESH A. GOPINATH, and HAITAO GUO, “Introduction to wavelets and wavelets transforms”, Prentice Hall, 1998.

[12] SAEED V. VASEGHI, “Advanced Signal Processing and Noise Reduction”, John Wiley & Sons, 2nd edition, 2000.

[13] S.F. BOLL, “Suppression of Acoustic Noise in Speech Using Spectral Subtrac- tion”, IEEE Trans. Acoust. Speech, Signal Proc., vol. ASSP-27, pp. 113-120, Apr. 1979.

[14] D. L. DONOHO, “Denoising by soft thresholding”, IEEE Trans. on Information Threory, pp. 961-1005, 1994.

[15] M. K. Hasan, M. S. A. ZILANY, and M. R. KHAN, “DCT speech enhancement with hard and soft thresholding criteria”, Electronics Letters, vol. 31, no. 13, pp.669-670, 20th June 2002.

[16] JONG WON SEOK, and KEUN SUNG BAE, “Speech enhancement with reduc- tion of noise components in the wavelet domain”, IEEE, pp. 1323-1326, 1997. [17] I. J. KIM, S. I. YANG, and Y. KWON, “Speech enhancement using adaptive

wavelet shrinkage”, Proceedings of IEEE International Symposium on Industrial Electronics, ISIE-2001, Vol. 1, pp. 501-504, 2001.

[18] H. Y. GAO, and A. G. BRUCE, “Waveshink with firm shrinkage”, Statistica Sinica, vol. 7, pp. 855-874, 1997.

[19] LEO BREIMAN, “Better subset regression using the nonnegative garrote”, Tech- nometrics, 37, 373-384, 1995.

[20] H. Y. GAO, “Wavelet shrinkage denoising using the nonnegative garrote”, J. Comput. Graph. Statist., 7 (4), pp. 469-488, 1998.

[21] BYUNG-JUN YOON, P.P. VAIDYANATHAN, “Wavelet-Based Denoising by Customized Thresholding”, ICASSP Conference, 2004. IEEE.

[22] SAEED AYAT, MOHAMMAD T. MANZURI, and ROOHOLLAH DIANNAT, “Wavelet based speech enhancement using a new thresholding algorithm”, Proc. of Int. Symp. on Intelligent Multimedia, Video and Speech Processing, pp. 238- 241, Oct. 2004.

[23] D. L. DONOHO, and I. M. JOHNSTONE, “Adapting to unknown smoothness via wavelet shrinkage”, Journal of American Statistics Assoc., vol. 90, no. 432, pp. 1200-1224, Dec. 1995.

[24] D. L. DONOHO, I. M. JOHNSTONE, “Threshold selection for wavelet shrinkage of noisy data”, Proc. of the 16th Annual International Conf. of the IEEE Eng. in Medicine and Biology Society, pp. A24- A25, Nov. 1994.

[25] D. L. DONOHO, and I. M. JOHNSTONE, “Ideal denoising in an orthonormal basis chosen from a library of bases”, C. R. Acad. Sci. Paris, Ser. I, 319, 1994. [26] I. Y. SOON, S. N. KOH, and C. K. YEO, “Noisy speech enhancement using

discrete cosine transform”, Speech Commun., vol. 24, pp. 249-257, 1998.

[27] J. S. GAROFOLO, L. F. LAMEL, W. M. FISHER, J. G. FISCUS, D. S. PAL- LET, and N. L. DAHLGREN, “The darpa timit acoustic-phonetic continuous speech corpus cdrom”, Cdrom, NIST, Gaithersburg, MD, 1996.

[28] JOHN H. MATHEWS, “Numerical methods for mathematics, science and engi- neering”, Prentice Hall, 2nd edition, 1992.

[29] DAVID G. LUENBERGER, “Linear and nonlinear programming”, Addison Wesley, 2nd edition, 1989.

[30] N. WEYRICH, G. T. WARHOLA, “De-noising using wavelets and cross valida- tion”, in S.P. Singh, editor, Approximation Theory, Wavelets and Applications, vol. 454 of NATO ASI Series C, pp. 523-532, 1995.

[31] YI HU, “Subspace and multitaper methods for speech enhancement”, Disserta- tion (Doctor of Philosophy in Electrical Engineering), Faculty of the Graduate School of the University of Texas at Dallas, Dec. 2003.

[32] L. RABINER and B. H. JUANG, “Fundamentals of speech recognition”, Prentice Hall, 1st edition, 1993.

Belgede Cebirsel düşünme becerisi üzerine bir meta – sentez çalışması (sayfa 30-35)