15
-- (! 960) -- CAHIERS D'ACOUSTIQUE * N O 110 SUR LES QUALITIES ESSENTIELLES DES VOCALES par Yoshiyuki OCHIAI ** et Teruo FUKUMURA ** SOMMAIRE. -- Les auteurs partent de cette constatation ma]eure : n~cessit~ de distinguer entre la qualitg de cc nettetd ~ dans la perception des voyelles (en tant que phondmes) et la qualitg de , elart~ ~ dans la perception des sons vocaux correspondants (,.'ocales), cette derni&e tenant eompte de l'extrdme diversitd des voix indlviduelles (varigt~ duns le timbre de voix des su]ets parlants ou ~ parleurs ~, [a9ons d'articuler plus ou molns distlnetement...). Ils rendent compte d'une longue s~rie d'exp~riences, condztite pendant ces six dernidres ann~es, pour l'gtude des caractdris- tiques de ces deux (~ qualitgs ~ par l'@reuve de plusieurs types de distorsion : principalement la distorslon par fil- trage de bandes et, dt title comparati[, la distorsion dite de (c synehronisation rotatoire ~ (vitesses di]~&entes d l'enre- gistrement et ~t la reproduction par magngtophone), peu employee, et la distorsion classique dlte (c d'affaiblissement ,, davantage utilis~e. Ils commentent longuement les rgsultats obtenus et prdsentent leurs conclusions ( notamment que c'est la ~ clartd ~, non la cc nettet~ ~, qui devrait ~tre adopt~e comme caractgristique de base pour estimer la qualh~ d' un systdme de transmission). PLAN. -- Introduction. -- ~. A~ant-propos. -- 2. Notion de qualitgs essentielles. -- 3. Procgdgs adoptgs. -- 4. Rgsul- tats d'expdriences utilisant la distorsion par suppression de bandes. -- 4A. R~sultats synthgtiques d'une s&ie d'exp6riences sur les qualit~s phon&nique et vocalique. -- 4.2. Rgsultats d'exp&iences sp~ciales mettant en lumi&e le earact~re des qualitds phon6mique et voealique. -- 4.2.]. Influence de l'intensitg vocale d'dmis- sion. -- 4.2.~. lnJ~uence du mode d'dmission avec voix ou sans voiae. -- 4.9.3. Amdlioration des qualitds des vocales par adjonction de consonnes antdcddentes. -- 6.3. R~sumg des rgsultats synthg- tiques concernant le comportement de la qualit~ phon~tique et de la qualit~ vocalique dans les distorsions dues dt la suppression de bands. -- 5. Rdsultats des expdrienees utilisant d'autres types de distorsions.- 5.L Des allures des qualit~s [ondamentales de la distorsion de synchronisme comparges avec celles de la distor- sion par suppression de bande. -- 5.2. De l'allure comparge dans les qualit~s [ondamentales des vocales dans la distorsion d'a~]aiblissement, et clans la distorsion de [rgquenee. -- 6. Discussion. -- 7. Conclusion. INTRODUCTION M. le pr Ochiai, dont les travaux h l'Universit6 de Nagoya (Japon) ont une large audience dans les milieux scientifiques mondiaux, s'est pr6occup6 de nombreux probl6mes de phon6tique et, tout sp6cialement, d'un probl6me qui int6resse les t616- communications, celui des facteurs qui intervien- nent dans l'intelligibilit~ des phonemes, supports et v6hicules essentiels de l'information, il s'est efforc6 d'analyser ce ph6nom6ne complexe et d'en dissocier les divers composants. En commun avec M. Teruo Fukumura, il a bien voulu pr6senter au G. A. L. F., dont il est un membre actif, les conceptions orlginales et le r6sultat de ses travaux et il l'a fair directement en franCals, comme le veut l'usage de notre Groupement : il a ainsi droit /~ d'autant plus de remerciements. I1 taut recon- naltre que le sujet 6tudi6 est complexe, quelque peu ardu, ne serait-ce que par son originalit6 et sa ~sp6cificit6)~ et qu'il n'6tait pas facile h traiter : d'o6 un certain nombre de n6ologismes et autres parti- cularit6s de langage que nous avons cru pr6f6rable de laisser subsister chaque lois qu'une intervention nous paraissalt risquer de trahir la pens6e de leur auteur. Nous pensons que l'6claircissement des id6es nou- velles apport6es dar, s ce travail peut contribuer une meilleure connaissance th6orique et pratique de ce domoine, fort ancien mais bien incompl6te- ment explor6, de l'intelligibilit6 t616phonique. P. CrIAVASSE Secr6taire G6n6ral du G. A. L. F. t. AVANT-PROPOS I1 y a plusieurs ann6es, nous avons entrepris une 6tude sur les qualit6s essentielles et fondamentales des vocales, en diff6renciant d'abord deux qualit6s, une qualit6 phon6mique et une qualit6 vocalique, puis en discutant la troisi6me qualit6, qui est rela- tive h l'intensit6 acoustique subjective (loudness en anglais). Nous avons consacr6 cinq ou six ann6es h la prerai6re question en nous limitant h la mesure des qualit6s de m~me genre. Mais, maintenant que nous croyons avoir d6jh atteint plusieurs r6sultats positifs, il convient de r6sumer les conclusions auxquelles nous a conduit cette s6rie d'exp6rlences. 2. NOTION DE QUALITIES ESSENTIELLES Avant d'aborder l'6tude d6taill6e, il est n6cessaire de tenir compte de la notion essentielle et fonda- mentale des qualit6s vocales. Pour ceux qui sont tr6s sensibles h l'essence des choses, il est bien apparent que le caract6re de la voyelle est tout diff6rent de eelui de la voix, bien * S6rie d'expos6s relatiis aux travaux du Groupement des Acousticiens de Langue Franqaise (G, A. L. F.). ** Laboratoire d'Audiologio, lJniversit6 de Nagoya (.lapon). 277-

Sur les qualités essentielles des vocales

Embed Size (px)

Citation preview

Page 1: Sur les qualités essentielles des vocales

- - (! 960) - - CAHIERS D'ACOUSTIQUE * N O 110

SUR LES QUALITIES ESSENTIELLES DES VOCALES

par Yoshiyuki OCHIAI ** et Teruo F U K U M U R A **

S O M M A I R E . - - Les auteurs partent de cette constatation ma]eure : n~cessit~ de distinguer entre la qualitg de cc nettetd ~ dans la perception des voyelles (en tant que phondmes) et la qualitg de , elart~ ~ dans la perception des sons vocaux correspondants (,.'ocales), cette derni&e tenant eompte de l'extrdme diversitd des voix indlviduelles (varigt~ duns le timbre de voix des su]ets parlants ou ~ parleurs ~, [a9ons d'articuler plus ou molns distlnetement...). Ils rendent compte d'une longue s~rie d'exp~riences, condztite pendant ces six dernidres ann~es, pour l'gtude des caractdris- tiques de ces deux (~ qualitgs ~ par l'@reuve de plusieurs types de distorsion : principalement la distorslon par fil- trage de bandes et, dt title comparati[, la distorsion dite de (c synehronisation rotatoire ~ (vitesses di]~&entes d l'enre- gistrement et ~t la reproduction par magngtophone), peu employee, et la distorsion classique dlte (c d'affaiblissement , , davantage utilis~e. Ils commentent longuement les rgsultats obtenus et prdsentent leurs conclusions ( notamment que c'est la ~ clartd ~, non la cc nettet~ ~, qui devrait ~tre adopt~e comme caractgristique de base pour estimer la qualh~

d' un systdme de transmission).

PLAN. - - Introduction. - - ~. A~ant-propos. - - 2. Notion de qualitgs essentielles. - - 3. Procgdgs adoptgs. - - 4. Rgsul- tats d ' e x p d r i e n c e s u t i l i s a n t la d i s t o r s i o n p a r s u p p r e s s i o n de b a n d e s . - - 4A. R~sultats synthgtiques d'une s&ie d'exp6riences sur les qualit~s phon&nique et vocalique. - - 4.2. Rgsultats d'exp&iences sp~ciales mettant en lumi&e le earact~re des qualitds phon6mique et voealique. - - 4.2.]. Inf luence de l ' i n t e n s i t g voca le d ' d m i s - s ion . - - 4.2.~. lnJ~uence du m o d e d ' d m i s s i o n avec vo ix ou s a n s voiae. - - 4.9.3. A m d l i o r a t i o n des qua l i td s des voca les p a r ad jonc t i on de c o n s o n n e s a n t d c d d e n t e s . -- 6.3. R~sumg des rgsultats synthg- tiques concernant le comportement de la qualit~ phon~tique et de la qualit~ vocalique dans les distorsions dues dt la suppression de bands. - - 5. Rdsultats des e x p d r i e n e e s u t i l i s a n t d ' a u t r e s t y p e s de d i s t o r s i o n s . - 5.L Des allures des qualit~s [ondamentales de la distorsion de synchronisme comparges avec celles de la distor- sion par suppression de bande. - - 5.2. De l'allure comparge dans les qualit~s [ondamentales des vocales dans la

distorsion d'a~]aiblissement, et clans la distorsion de [rgquenee. - - 6. D i s c u s s i o n . - - 7. Conclusion.

I N T R O D U C T I O N

M. le pr Ochiai, dont les t ravaux h l 'Universit6 de Nagoya (Japon) ont une large audience dans les milieux scientifiques mondiaux, s'est pr6occup6 de nombreux probl6mes de phon6tique et, tout sp6cialement, d 'un probl6me qui int6resse les t616- communications, celui des facteurs qui intervien- nent dans l'intelligibilit~ des phonemes, supports et v6hicules essentiels de l ' information, il s'est efforc6 d'analyser ce ph6nom6ne complexe et d'en dissocier les divers composants.

En commun avec M. Teruo Fukumura , il a bien voulu pr6senter au G. A. L. F., dont il est un membre actif, les conceptions orlginales et le r6sultat de ses t ravaux et il l 'a fair directement en franCals, comme le veut l 'usage de notre Groupement : il a ainsi droit /~ d ' au tan t plus de remerciements. I1 taut recon- naltre que le sujet 6tudi6 est complexe, quelque peu ardu, ne serait-ce que par son originalit6 et sa ~sp6cificit6)~ et qu'il n '6tait pas facile h traiter : d'o6 un certain nombre de n6ologismes et autres parti- cularit6s de langage que nous avons cru pr6f6rable de laisser subsister chaque lois qu'une intervention nous paraissalt risquer de t rahir la pens6e de leur auteur.

Nous pensons que l'6claircissement des id6es nou- velles apport6es dar, s ce travail peut contribuer

une meilleure connaissance th6orique et pratique de ce domoine, fort ancien mais bien incompl6te- ment explor6, de l'intelligibilit6 t616phonique.

P. CrIAVASSE Secr6taire G6n6ral du G. A. L. F.

t . A V A N T - P R O P O S

I1 y a plusieurs ann6es, nous avons entrepris une 6tude sur les qualit6s essentielles et fondamentales des vocales, en diff6renciant d 'abord deux qualit6s, une qualit6 phon6mique et une qualit6 vocalique, puis en discutant la troisi6me qualit6, qui est rela- tive h l 'intensit6 acoustique subjective (loudness en anglais). Nous avons consacr6 cinq ou six ann6es h la prerai6re question en nous l imi tant h la mesure des qualit6s de m~me genre. Mais, maintenant que nous croyons avoir d6jh at teint plusieurs r6sultats positifs, il convient de r6sumer les conclusions auxquelles nous a conduit cette s6rie d'exp6rlences.

2. N O T I O N D E Q U A L I T I E S E S S E N T I E L L E S

Avant d'aborder l '6tude d6taill6e, il est n6cessaire de tenir compte de la notion essentielle et fonda- mentale des qualit6s vocales.

Pour ceux qui sont tr6s sensibles h l'essence des choses, il est bien apparent que le caract6re de la voyelle est tout diff6rent de eelui de la voix, bien

* S6rie d'expos6s relatiis aux t ravaux du Groupement des Acousticiens de Langue Franqaise (G, A. L. F.). ** Laboratoire d'Audiologio, lJniversit6 de Nagoya (.lapon).

2 7 7 -

Page 2: Sur les qualités essentielles des vocales

2 / t6 Y. OCHIAI E T

qu 'en fait, au cours de l'6mission des sons vocaux (vocales) r6els, l 'un est toujours et si in61uctable- ment accompagn6 de l 'autre que l 'on a peine h les s6parer l 'un de l 'autre [l].

De mgme que la science de la phon6tique a pro- gress6 dans sa propre vole en poursuivant le pro- blame des phonemes, sans apporter aucune connais- sance nouvelle sur la voix, de mgme la technologie de la communicat ion des paroles a fair de grand progr~s en se l imitant , c'est-h-dire, en a t t achan t seulement de l ' importance h la transmission des paroles du point de vue de la net tet6 ou de l 'intel- ligibilit6, sans prendre s6rieusement en consid6ra- tion la transmission de la voix. De sorte que plu- sieurs instruments op6rant par l ' impression des paroles ont 6t6 6tudi6s et construits en rue de la discrimination des phonemes seulement, sans aucun souci de la diff6renciation d61icate et (( saisissante )> des voix individuelles.

Nous pensons qu'il reste, mgme aujourd 'hui , un grand probl6me encore non r6solu en ce qui concerne la diff6rence essentielle entre phoneme et voix. C'est la quest ion pr6alable, t an t pour les probl~mes de transmission des paroles en t616communication, que pour la r6alisation d ' instruments actionn6s par des paroles.

En analysant , rat ionnellement, et dans son essence, la quest ion en dehors des probl6mes r6els et pratiques, il nous revient h l 'esprit que c'est elle qui est l 'objet de la discussion, la plus fondamentale, sur le caract~re essentiel des (( formants )) des sons vocaux (vocales) ainsi baptis6s pour la premiere fois par L. Hermann il y a environ cent ans. Une consid6ration quelque peu crit ique nous am~nera h la d6couverte que ledit formant est, en effet, h consid6rer du point de r u e phon6mique, tandis qu'il ne l 'est pas du point de rue vocal. S'il est vrai que l 'on peut discerner, non seulement les phonemes des voyelles, mais aussi les voix des ~< parleurs )), comme nous le savons bien par notre exp6rience habituelle, pourquoi ne peut-on v6rifier le fait que la (( qualit6 de nettet6 )), bas6e sur l 'iden- t if ication et la discrimination des phonemes, est toute diff6rente de la qualit6 de (< clart6 >) bas6e sur l ' identification et la discrimination des voix ? Et , par vole de cons6quence, pourquoi ne peut-on consi- d6rer et d6finir, non seulement le formant relatif au phoneme (formant phon6mique) mais aussi le formant relatif h la voix (formant voca l ique)? Donner les deux sens an (( formant >), ou, pour mieux dire, rest i tuer le sens vocalique en dehors du sens phon6mique, est tr~s naturel et mgme urgent pour nos connaissances sur le formant , parce que la consid6ration tradit ionnelle du formant n 'est pas (( d6sint6ress6e >), mais en fair unilat6rale ; ~ propre- ment parler, c 'est un renseignement entach6 de part ial i t6 [2, 3, 4].

Or, quel rble jouent donc les vocales dans nos paroles ? E t quelle par t prennent les voyelles dans notre langage ? Du point de vue de l '6valuation des paroles consid6r6es dans leur ensemble, et de la

T. F U K U M U R A IANNALES DES T~LI~COMMUNICATIONS

question pos6e par n o u s - - d 6 t e r m i n e r judicieu- sement les qualit6s fondamentales des v o c a l e s - - que signifie cette 6tude ? C'est ce que nous allons voir en premier lieu.

En gros, nous pouvons consid6rer que, dans nos langages, le mot est constitu6 par des consonnes et des voyelles. La plupart des mots s '6tablissemt, en principe, par la combinaison des consonnes et des voyelles, souvent d 'une seule voyelle, et tr6s rare- ment d 'une seule consonne. La consonne est g6n6- ra lement difflcile, mais non i:rpossible, ~ prononcer sans l 'aide des voyelles, tandis que la voyelle est tr~s facile ~ prononcer par elle-m6me.

Les consonnes sont plus riches en (( variat ions >) que les voyelles. Mais sous le rappor t de la vari6t6 et de la multiplicit6 des modes d'6mission pour un seul son, la voyelle est beaucoup plus <( fiche >~ que la consonne. Par exemple, on ne peut 6mettre la consonne que sous deux formes diff6rentes : forme forte ou forme douce, forme rapide ou forme lente, tandis que la voyelle peut ~tre 6mise de fa~ons mul- tiples et diverses, t an t6 t par la diff6rence de l 'effort vocal (intensit6 de l'6mission), t an t6 t par la diff6- rence des hauteurs musicales; on peut aussi pro- noncer la mgme voyelle (( avec voix >> (voyelle voca- lis6e ou sonore) ou << sans voix ~> (voyelle chuchot6e) ; on peut 6galement diversifier au tan t que l 'on veut la dur6e d'6mission. On peut, encore, caract6riser la modulat ion des voyelles par l 'asservissement au syst~me des cavit6s nasales (voyelles nasalis6es) et par le contr61e de la cavit6 laryng6e (voix voil6e ou couverte). La diversit6 du mode d'6mission peut donner aux sons vocaux (que nous d6signerons convent ionnel lement sous le nora de <( vocales ))) beaucoup de nuances ext r6mement fnes et d61i- cares pour agir sur leur t imbre.

En r6sum6, la vari6t6 d 'expression de la voyelle est tr~s sup6rieure h celle de la consonne. En d 'autres termes : on peut inclure incomparablement plus d'expressions humaines dans la voyelle, qui forme comme la moelle 6pini~re du corps de la parole, que dans la consonne. Quand on pense aux modalit6s illimit6es du t imbre des vocales, on peut en conclure imm6dia tement qu'il y a beaucoup d'expressions humaines inh6rentes h la s t ructure de ces vocales.

3. PROC2D2S A D O P T 2 S

Conform6ment h la dist inction sommaire quc nous venons de faire des qualit6s des vocales, il nous est, d 'abord, n6cessaire de v6rifier la diff6rcnce essentielle entre la qualit6 phon6mique et la qualit6 vocalique. Pour le faire d 'une fa~on caract6ristique essentielle nous devons pr6parer une exp6rience o5 les vocales sont soumises h la mesure des qualit6s, apr~s avoir subi la d6formation structurale de fr6- quence par des fihrages de bande int rodui ts dans le syst~me de transmission. Par ce proc6d6 d'exp6ri- mentat ion, on peut non seulement d6terminer la valeur des qualit6s des vocales sans d6formation, mais aussi pr6ciser davantage le compor tement

278

Page 3: Sur les qualités essentielles des vocales

t. 15, n ~ 11-12, 1960]

d6tail l6 de ces qualit6s, quand les vocales sont sou- mises h une distorsion de fr6quence (par bande). On a recours h cette distorsion par bandes parce que le formant dolt ~tre, en g6n6ral, consid@6 et d6fini comme une sorte de structure fond6e sur la fr6- quence. Par les apports relatifs entre la fr6quence de coupure et les ((valeurs)~ des vocales et des voyelles, nous esp6rons distinguer la qualit6 phon6- mique de la qualit6 vocalique. Du fait que, d 'une part, la mesure des qualit6s est g6n@alement assez difficile, et que, d 'autre part, nous avons, les pre- miers, fait des exp@iences sur la qualit6 vocalique, il nous a fallu effectuer des exp6riences de ce genre h plusieurs reprises au cours de ces derni6res ann6es.

I1 va sans dire que, pour l '6tude de la qualit6 vocalique au moins, il est tr~s important et n6ces- saire d 'examiner l'influence des diverses conditions d'6mission des vocales sur les types vocaliques du t imbre et, par suite, sur la qualit6 vocalique. Bien entendu, il n'est ni inutile, ni sans int6rOt, d'6tudier les effets de l 'intensit6 d'6mission et de la hauteur tonale sur la nettet6 des phonemes des voyelles. Mais le but pr6cis de la d6finition de la qualit6 vocalique est plutSt d 'examiner en d6tail l 'influence de l ' intensit6 sonore et de la hauteur tonale d'6mis- sion sur la clart6 des voix, c'est-h-dire, sur la qualit6 vocalique.

Si nous r6duisons cette conception h sa base la plus essentielle, nous aboutissons h l'influence du mode fondamental d ' 6 m i s s i o n - c'est-h-dire mode chuchot6 (sans voix) ou sonore (avec v o i x ) - res- pectivement sur la nettet6 des phonemes et sur la clart6 des voix. C'est, peut-6tre, le probl~me le plus important et le plus utile pour mettre en lumi~re la formation d6taill6e et l '6tablissement pr6cis des qualit6s essentielles, la phon6mique et la vocalique. L'exp6rience qui s'impose ici a pour but d'6claircir et de diff6rencier les influences individuelles d'6mis- sion, d 'un simple souffle et d 'une voix bien 6tablie, sur la formation des structures formantiques et par suite sur l '6tablissement des qualit6s formantiques. Autrement dit, notre exp6rience dolt et peut r6pon- dre aux questions suivantes : quels effets ont les modes d'6mission et d 'expiration sur la qualit6 phon6mique et la qualit6 vocalique respective- ment ? De m6me, quelles influences exercent les modes d'6mission de la voix sur l '6tablissement de la qualit6 phon6mique et de la qualit6 vocalique respectivement ? C'est le probl~me qui se pose ici, dans cette 6tape des exp6riences. I1 est tr6s int6- ressant d'envisager ce probl~me en tra~ant les allures des caract6ristiques de chaque qualit6 r6pon- dant h chaque condition de la distorsion par sup- pression de bandes.

Nous avons, grosso modo, examin6 les caract6ris- ristiques des qualit6s r6pondant h la distorsion par suppression de bande. Cependant, en dehors de cette distorsion, nous avons 6galement utilis6 les autres distorsions, par exemple la distorsion d'affai- blissement et la distorsion de synchronisme entre enregistrement et reproduction. Nous avons pour

S U R LES QUA.LITI~S E S S E N T I E L L E S DES VOCALES 3/16

premier but de eonstater la diff6renee 6vidente entre la qualit6 phon6mique et la qualit6 voealique, diff6vence r6v616e d'une autre fagon par l 'utilisation des distorsions d'autres types que la distorsion par suppression de bandes. Pour le second but, qui est d'utiliser la distorsion d'affaiblissement, nous devons exposer la n6cessit6 d'6tudier l '6quivalenee r6eiproque entre distorsions de diff6rentes natures, 6tude qui nous amine tout de suite au probl~me technologique fondamental ofJ il s 'agit d '6valuation des syst~mes de communieation des paroles.

Nous devons mettre en 6vidence notre notion de base sur la qualit6 fondamentale du t imbre des vocales. Quand il s'agit de la finesse de la structure formantique, il est n6cessaire pour le moment de traiter ce probl~me purement au point de vue de la structure statique. Autrement dit, il convient d 'abord de consid6rer la qualit6 sous l'angle, du timbre au sens pur [3] en laissant de c6t6 routes les diff6rences provenant soit de l 'intensit6 acoustique subjective, soit de la hauteur tonale ; par cons6- quent, il est strictement n6cessaire de rendre iden- tiques t o u s l e s signaux des vocales, t an t relative- ment h l 'intensit6 sonore subjective que relati- vement h la hauteur tonale. I1 est plus n6cessaJre encore de laisser de c6t6 toutes les diff6renees caus6es par la diversit6 des r6gimes transitoires des signaux 6mis, e'est-'h-dire de la patt ie d 'a t taque d'une part et de la partie d 'ext inct ion d 'autre part, et ainsi de laisser seulement la patt ie permanente du corps des signaux comme objets d'observation.

4. R I ~ . S U L T A T S D ' E X P i ~ . R I E N C E S U T I L I S A N T L A D I S T O R S I O N

P A R S U P P R E S S I O N D E B A N D E S

4.1. R~sultats synth6tiques d'une s~rie d'ex= p~riences sur les quaHt~s phon~mique et voca~ Hque. Distorsion par suppression de bande.

Nous montrons d'abord les r6sultats d'exp6riences, fr6quemment r6p6t6es pendant plusieurs ann6es et concernant la qualit6 phon6mique et la qualit6 voca- lique, relatives aux vocales qui r6pondent h la dis- torsion par suppression de bandes. La figure I donne sommairement toutes les caract6ristiques de ces qualit6s, phon6mique et vocalique, des vocales. Par cette repr6sentation, la figure 1, oh la caract6ris- t ique de la qualit6 phon6mique et la caract6ristique de la qualit6 vocalique sont donn6es s6par6ment, montre tr6s net tement que, grosso modo, la caract6- ristique de la qualit6 phon6mique est tout h falt diff6rente de celle de la qualit6 vocalique : la pre- miere ne subit pas de perte appr6ciable du fait de la distorsion due h u n filtre passe-bas, quand la dis- torsion n'est pas tr~s grande ; mais elle montre une chute tr~s rapide quand la distorsion augmente et tend h d6passer une certaine limite ; la seconde, au contraire, pr6sente d~s les d6buts une certaine baisse de qualit6, mais ne montre pas de chute brus- quement accentu6e, m6me lorsque la distorsion due

- - 279 - -

Page 4: Sur les qualités essentielles des vocales

4B6 la eoupure a t te int une grandeur suffisante. Quoi-

que ces exp6riences soient faites sur diverses combi- naisons de l'ensemble des voix des sujets parlant et de l 'ensemble des 6quipes des sujets 6coutant,

% 7~c

/ '0

2O

/aO

8O

6O

20

t ~

F I G . 1 . - - S o m m a i r e d e s c a r a c t 6 r i s t i q u e s d e s q u a l i t 6 s r e s p e c - tives de nettet6 des phon6mes et de clart6 des voix, fournies par les exp6riences de qualit6 darts la distorsion de bande 61iminatoire, souvent r6p6t6es dans notre laboratoire au cours de ces six derni6res ann6es, a) repr6sente le groupe des earact6ristiques de nettet6 des voyelles, et (b) celui de clart6 des voix.

une paire de caract6ristiques de la qualit6 phon6- mique a une allure route diff6rente de celle des carac- t6ristiques de la qualit6 vocalique. La diff6rence entre les deux paires de caract6ristiques, la phon6- mique et la vocalique, peut ~tre trouv6e, d'm~e part, dans la forme des caract6ristiques, c'est-h-dire dans la pente ou le d6nivellement des courbes, et, d 'autre part, dans la position du point d'interseetion de ehaque paire de caract6ristiques relatives h la m~me qualit6. Le point d'intersection de la paire de carac- t6ristiques phon6miques se trouve dans la r6gion de i,2-1,5 kHz, tandis que le point d'intersection de la paire de caract6ristiques vocaliques se place dans la r6gion de 1,4-1,8 kHz. Le fait que le point d'interseetlon des caract6ristiques de qualit6 est un peu diff6rent selon la nature des qualit6s est de pre- miere importance, quoique la diff6rence soit petite. Nous nous bornerons cependant, ici, ~ une descrip- t ion g6n6rale et proe6derons plus loin ~ une 6tude d6taill6e.

Sur la figure 2 nous montrons la repr6sentation individueUe, clans l 'ordre des hauteurs musicales, des voix utilis6es darts nos exp6riences. Cette repr6- sentation est faite en prenant ~ la fois la caract6- ristique phon6mique et la caract6ristique vocalique pour chaque exp6rience. Par eette repr6sentation

Y . O C H I A I E T T . F U K U M U R A [ A N N A L E S D E S T ~ L ~ C O M M U N I C A T I O N S

individuelle, nous pouvons examiner plus en d6tail comment se comporte le point d'intersection des caract6ristiques. On volt que le point d'intersection

% 700

go

~0

70o

gO

6O

700

80

60

700

8o

6o

~o

8o

~o

7oo

oosK<

I i i T , T T , , I , i t ~ , , i t

7- ?f2- / ; " \ --...

L i i i t i i l l 1 i i . . . . .

f % ",

, i i i i i i i i 1 . , I I I I I I I i I

2 3 0

80 . _

6 0 �9

i I t I t l i f t , ] i , f ~ i t ,

l ~ r ~ e e ae c r

Fro. 2. - - Repr6sentation d6taill~e des qualit6s des voeales, raise en paire de nettet6 et de clart6, et donn6e par para- m~tre des voix utilis6es darts les six exp6riences indivi- duelles. En abscisse, les fr6quences de coupure sont por- t6es suivant une 6chelle logarithmique et, en ordonn6e, sont respectivement port6es les valeurs des pourcentages des qualit6s de nettet6 et de clart6.

des caract6ristiques phon6miques ne semble pas gtre influenc6 appr6ciablement par la diff6rence de la hauteur tonale ; il semble toujours rester dans des limites tr~s 6troites de fr6quence de 1,2 ~ ],5 kHz. Au contraire, le point d'intersection des caract6ris- tiques vocaliques semble subir une influence ind6- niable de la hauteur musicale des voix : h mesure que la hauteur musicale s'6lhve, l 'ordonn6e du point

280 - -

Page 5: Sur les qualités essentielles des vocales

t. 15, n ~ 11-12, 19601 SUR LES QUALIT~S ESSENTiELLES :DEs u 5/16

d ' intersect ion va croissant ; il semble se inouvoir un peu vers le haut avec la hau teur musicale des voix, ce qui signifie que la s tructure de la qualit6 vocalique change graduellement en fonction de l 'accroissement de la hauteur musicale, de sorte que la qualit6 vocalique d6finie dans la s t ructure sup6rieure devient un peu plus (( dense )) que la qualit6 vocalique d6fi- nie dans la s t ructure inf6rieure. C'est lh que le franchissement du point d ' intersection peut avoir la signification la plus grande. La diff6rence en valeur num6rique absolue entre la qualit6 phon6- mique et la qualit6 vocalique est faible, particuli~- rement au d6but des caract6ristiques. Cela montre simplement que l '6quipe d 'audi teurs s 'accoutume de la m~me fa~on h la mesure de la qualit6 phon~- mique et h la mesure de la qualit6 voealique ; 6vi- demment cette derni~re est plus difflcile que la premiere.

4.2. Rdsu l ta t s d 'exp~riences spdciales m e t t a n t e n lutni~re le c a r a c t ~ r e d e s quali t6s p h o n g m i q u e et vocalique.

Apr~s avoir fait la description des caract6ristiques g6n6rales de la qualit6 phon6mique ainsi que celles de la qualit6 vocalique dans la distorsion par sup- pression de bandes, nous allons montrer quelques autres exp6riences du m~me genre faites dans l ' intent ion de chercher part iculi~rement le carac- tgre d6taill6 de ces deux qualit$s. Plus exactement nous avons d6crit ci-dessus les traits g6n6raux des caract6ristiques des qualit6s phon6mique et voca- lique, traits qui valent sarement pour n ' impor te quel ensemble de voix et n ' importe quelle 6quipe d 'auditeurs ; reals, pour mieux met t re en lumi~re le caract~re sp6cifique de ces deux qualit6s, il nous est n~cessaire d 'entreprendre des exp6riences plus strictes et plus approfondies, hinsi nous devrons faire quelques exp6riences tr6s exactes, en s~lec- t ionnant la condit ion d%mission comme seul para- m~tre d'exp6rience et en main tenan t invariables, au tan t que possible, au cours de l 'exp6rience, routes les autres conditions. Nous avons ainsi essay6 de d6tecter, de la fa~on la plus nette, l ' influence d 'un param~tre d'6mission sur la format ion des qualit6s individuelles, phon6mique et vocalique. Nous sp6ci- fierons ensuite les ph6nom~nes de qualit6 qui sont utilisables pour rendre compte de la sp6cificit6 de la qualit6 phon6mique et de la qualit6 vocalique.

4.2.1. Influence de l ' intensit6 vocale d '~mis= sion.

C'est le r6sultat de l 'exp6rience o~t sont employgs respect ivement , comme voix, un ensemble de cinq voix, et comme phonemes, un ensemble de cinq voyelles ; la hauteur tonale des vocales est exac- tement 240 Hz ; en ce qui concerne l '6mission des vocales, deux niveaux d' intensit6 ont 6t6 choisis, piano et /orte, dont la diff6rence est d 'environ 10- t5 dB suivant les indications du VU-mgtre. L '6quipe

d 'auditeurs est compos6e de quatre personnes. Notre bu t dans cette exp6rience est de t rouver la diff6- fence en qualit6 phon6mique et la diff6rence en qualit6 vocalique, routes deux inh6rentes, avec une diff6rence d' intensit6 entre iorte et piano assez grande pour a t te indre environ 10-15 dB.

I1 n'est pas inutile d 'a jouter ici une remarque : il ne nous int6ressait pas d '6tudier ce probl~me des vocales forc6es oh il s 'agit de mesurer l 'intelligibi- lit6 en fonction de l ' intensit6 d'6mission, ou, par exemple, si la voix plus forte correspondait h une intelligibilit6 moindre. La vraie signification de cette exp6rience consiste essentiellement en ce qui touche le centre du probl6me du t imbre : ce h quoi nous nous int6ressons, c 'est h la diff6rence de r6par- t i t ion des qualit6s du t imbre caus6e par la diff6- fence des modes d'6mission, c'est-h-dire par la diff6rence entre piano et [orte, mais nous ne nous int6ressons pas h la diff6rence d' intensit6 sonore

1

a

%

7OO

4o

2o

%

I [ , I l l l l l _ Jl I,

4o IIIII

' II[ll II11/ )

I I I I

I J

O,7 O,2 0,3 q~ 0,7 7,0 ;,~ 2 3 ,- s ~ 7 lt~cl~a~s do ctmlatt,e

FIG. 3 . - ReprSsentation de la variation des qualit6s res- pectives de nettet6 et de clart6, caus6e par la variation de l'intensi16 voeale d'6inission, c'est-~-dire par la diff6- rence entre /orte et piano. La diff6rence de niveau donn6e par le VU-mStre est presque de t 0-J 5 dB, suivant la diff6- fence des voix utilis6es. La hauteur musicale est maintenue strictement ~ 260 Hz pour toutes les voyelles et pour toutes les voix. La distorsion ulilis6e ic ies t celle de coupure passe-haut et passe-bas. (a) repr6sente la diff6renee des caract6ristiques de nettet6, et (b) la diff6rence des carac- t6ristiques de clart6 en fonction de la variation de timbre caus6e par le changement d'intensit6 d'6mission, Dans cctte repr6sentation ([) signifie la caract6ristique des qualit6s par 6mission ]orte, et (p) celle par 6mission piano.

subjective due h la mgme cause. Aut rement dit, nous t rai tons ce probl~me des vocales forc6es du point de ru e du t imbre (( au sens pu t ~). C'est pour cette raison que nous avons pris soin d 'adopter tous

281

Page 6: Sur les qualités essentielles des vocales

6 / 1 6 Y. OCH,Ai ~T

les signaux utilis6s dans notre exp6rienee, parti- culi6rement des signaux forts et signaux faibles.

Nous montrons sur la figure 3a une paire de caract6ristiques de la qualit6 phon6mique des vocales ~ 6mission forte comparativement avec une paire de caract6ristiques de la m6me qualit6 des vocales h 6mission deuce, et de m~me sur la figure 3b une paire de caract6ristiques de la qualit6 voca- lique h 6mission forte prise comparativement avec une paire de caract6ristiques de la m6me qualit6 des vocales h 6mission deuce. Par l'effet des filtres passe-bas on peut pr6sumer exclusivement la r6par- tition de la qualit6 dans la structure basse, et par l'effet des fihres passe-haut on peut conjecturer exclusivement la distribution de la qualit6 dans la structure haute. Par la diff6rence des caract6ris- tiques des deux modalit6s d'6mission,/orte et piano , on peut consid6rer la diff6rence de qualit6s eaus6e par la diff6rence des intensit6s d'6mission. Par suite de cette exp6rience, off l'ensemble des voyelles 6raises au niveau piano est tout h fair m61ang6, sans ordre et sans suite, avec l'ensemble des voyelles 6mises au niveau [orte, et off l'on exige de juger seu- lement et purement du point de rue du timbre structural grace au proc6d6 de balance (en volume) entre les signaux h 6mission faible et les signaux ~a 6mission forte, on peut imm6diatement obtenir des informations sur la modification de la r6partition de la qualit6 dans la structure du timbre des vocales en fonction de la fr6quence. Trop peu de diff6rence de la qualit6 phon6mique entre 6mlssion forte et 6mission deuce r6v61e ce fait que le mode de la r6partition de la qualit6 phon6mique ne subit qu'assez peu l'intluence de la diff6rence d'intensit6 d'6mission. Au contraire, la qualit6 vocalique est sensible au mode de r6partition de cette qualit6 par suite de la diff6rence d'intensit6 d'6mission. Quand on veut examiner en d6tail le comportement de cette diff6renee relative h la distribution de la qualit6 vocalique, il vient h l'esprit qu'h cette influence d'6mission la qualit6 vocalique est un peu plus sensible dans la structure haute que dans la structure basse, car la diff6rence de la qualit6 entre 6mission forte et 6mission faible est un peu plus marqu6e darts les caract6ristiques h coupure 61ev6e que dans les caract6ristiques h coupure basse. Par cons6quent, il en r6suhe que le point d'intersection d'une paire de caract6ristiques de basse fr6quence de coupure et de caract6ristiques de haute fr6quence de coupure se d6place quelque peu vers le haut selon que le niveau d'6mission change de [orte h p iano . En r6sum6, l 'augmentation ou l'affaiblissement du niveau d'6mission n'a gu~re d'influence sur la qua- lit6 phon6mique, c'est-h-dire sur la nettet6 des voyelles, tandis que le m~me changement de niveau a une influence appr6ciable sur la qualit6 vocalique, c'est-~-dire sur la clart6 des vo.x. Autrement dit, l'616ment phon6mique est presque ind6pendant de la condition d'6mission des voix, mais l'616ment vocalique se trouve asservi h cette condition [51.

Dans la premiere d6finition des ((types phon6-

T. FUKUMURA [ANNALES DES TlgL]~COMMUNICATIONS

miques ~> et de c~ types voealiques ~ qui a 6t6 faite en t953 [6], nous avons pris pour hypoth6se que le type phon6mique dolt gtre d6fini comme ind6pen- dant de la condition d'6mission, c'est-h-dire du niveau d'intensit6 d'6mission et de la hauteur tonale d'6mission, tandis que le type vocalique dolt et peut gtre d6pendant des conditions d'6mission. C'est, h coup sOr, vrai ; nous avons pu v6rifier ce fair exp6rimentalement.

Maintenant, nous allons montrer le changement du type des vocales caus6 par le changement d'intensit6 d'6mission. Bien que ce changement se produise diff6remment selon les voyelles et les voix des r parleurs ~, le point de changement le plus commun se trouve dans la tendance suivante : par suite de l 'augmentation d'intensit6 d'6mission du niveau p iano au niveau /orte, la structure basse (c'est-h- dire la partie de la structure situ6e au-dessous du point de vall6e) subit un tel changement que l'ampli- rude des composants plus basses devient un peu plus faible et l 'amplitude des composants plus hautes devient un peu plus grande ; par suite l'enveloppe des structures des vocales h 6mission forte a un certain point situ6 entre le point de (( hauteur tonale ,, fondamentale et le point de cc vall6e ,,. Quant h la partie de la structure haute (c'est-h-dire la structure partielle qui se place au-dessus du point de vall6e), elle subit un changement relativement simple, tous les composants donnant plus fort du fair de l'aug-

• (o- ~n%,--

4o

,:1o

2o,

70. " " , \ /NAA

o,7 o,~ o,j o~ g~ 'o,;7 " ' ~, (~ ~. ~ ; ~ ' ~, kN" s ltt.~lwlloc

FiG. 4 . ~ Repr6sen t a t i on de la va r i a t ion du t y p e m o y e n du t imbre des vocales , caus6e par la diff6rence d ' in tens i t6 de l '6mission en t re n iveau (~/orte ,3 e t n iveau tc p i a n o ~.

mentation d'intensit6 d'6mission. La figure 4 montre Failure de changement des formes des vocales en g6n6ral. En nous r6f6rant h cette repr6- sentation moyenne, nous pouvons raisonnablement imaginer que chaque forme de voyelle et chaque forme de voix peut varlet suivant la variation respective des voyelles et des voix ;mais nous pou- vons constater que la forme h signal fort et la forme signal faible se croisent invariablement, et encore : que le point d'intersection est toujours le mgme malgr6 la variation des phonemes et des voix.

4 . 2 . 2 . h l H u e l l c e d u m o d e d ' d m i s s i o n a v e c v o i x o u s a B s v o i x .

II s'agit ici de l'influence des modes d'6mission les plus essentiels, c'est-a-dire de r6mission sans voix

282

Page 7: Sur les qualités essentielles des vocales

t. 15, n ~ 11-12, 1960] S U I I L E S Q U A L I T E S E S S E 1 N T I E L L E S D E S V O C A L E S 7/16

et de l'6mission avec voix, sur les qualit6s phon6- mique et vocalique respectivement. Nous montrons sur la figure 5a, la diff6rence de la caract6ristique

~A /do

i

i

2o

%

/kX, l I II '/k\l I I I ' 1 \ t Ili

1 I l l II'1 I I III

i 60 " _ #S % % .

Iz /o

{ '; . . . . . . ", . . . . . s S ~ - - - w - ~ " (3) I I t / 7 " ~ - , , , , ~ , ~ ~ I I . .

/ l/l/J, / I1: ~7

Fz~q~e de ooupure

Fro. 5 . - t lepr6sentat ion de la var ia t ion des qualit6s respeetives de ne t te t6 et de clart6, eaus6e par la diff6- rence des modalit6s d'6mission des vocales, e'est-fi-dire la diff6renee entre souffiement (sans voix) et voealisation (avee voix), var ia t ion vue sous l 'angle d '6 tabl issement des qualit6s respectives en dimension de fr6quenee, en employant les distorsions de coupure passe-haut et passse- has . {a) repr6sente les earaet6risliques de net te t6 , et (b) les earaet6ristiques de elart6. I)ans eette repr6sen- ta t ion , (v) signifie la caraet6rist ique des qualit6s par 6mis- sion de vocalisation, et (s) celle par 6mission du souffiement.

de la qualit6 phon6mique apport6e par deux modes d'6mission, et sur la figure 5b la diff6rence de la caract6ristique de la qualit6 vocalique apport6e par les m6mes modes diff6rents. Darts cette exp6- rience, un ensemble de cinq parleurs (quatre hommes une femme) et une 6quipe de quatre auditeurs sont employ6s. Le proc6d6 d'exp6rimentatlon est le m6me que pr6c6demment. Ce qui est diff6rent dans cette exp6rience c'est le mode d'6mission : une moda- lit6 consiste h 6mettre ~( avec voix~) sur la hauteur tonale stricte de 240 Hz ; l'autre, par 6mission sans voix, c'est-~-dire par chuchotement.

Pour examiner en d6tail l'influence d'un para- m6tre d'6mission sur la forme des caract6ristiques des deux qualit6s, ou pour d6tecter attentivement la 16g6re diff6rence entre les deux caract6ristiques de r6ponses diff6rentes, comme c'est le cas, il serait tr6s utile et important du point de rue pratique de classer grosso modo la diff6rence d'allure des deux caract6ristiques de ce genre en trois types: le premier cas est celui o6 la diff6rence entre les deux

caract6ristiques est presque invariable tout le long des courbes et 06 l'une de ces deux caract6ristiques est ais6ment obtenue par une translation faite paral- 161ement h l'autre ; le second type diff6re du troi- si6me en ce que la diff6rence entre les deux carac- t6ristiques diminue ou augmente h mesure que la distorsion devient plus grande. Par Hnterm6diaire de cette base de comparaison, on peut 6tudier avee aisance et avec s6curit6 l'influence de certalns param~tres exp6rimentaux sur des caraet6ristiques de la qualit6 individuelle.

En examinant plus attentivement la figure 5, on est conduit h la d6couverte la plus importante, h savoir que, grace h l'6mission du souffle, la nettet6 des voyelles peut d6jh atteindre la valeur tr6s sutfisante d'environ 90 ~ tandis que l'6mission du souffle ne peut donner qu'une valeur tr6s faible it la clart6 des voix : environ 55 %. La voix bien 6tablie ne peut ainsi gu&e ajouter ~ la nettet6 des voyettes donn6es par souff‚ alors qu'elle peut amener une augmentation notable de la valeur, plus faible, des vocales mal form6es par le souffle. Autrement dit, les phon6mes des voyelles sont d6j~, et sufflsamment, form6s par l'6mission du souffle (il n 'y a comme marge de nettet6 qu'un peu moins de 10 % ~ gagner par la voix bien 6tablie) ; tandis que les sons des vocales sont insufllsamment 6tablis par le chucho- tement et sont am61ior6s par l'6mission en mode sonore (la hauteur tonale d6finitive rendant les vocales bien discernables les unes des autres). Le caract6re sp6cifique des qualit6s, explicit6 ci-dessus, est montr6 d'une fa~on plus 6vidente par la repr6- sentation des allures des caract6ristiques des qualit6s par bande de fr6quences. On y volt que la nettet6 des voyelles est influenc6e par les distorsions /~ basse fr6quence de coupure ainsi que par les dis- torsions h haute fr6quence de coupure, montrant une difference presque constante d'environ l0 ~ le long de la caraet6ristique, comme diff6rence entre 6mission vocalis6e et 6mission chuchot6e. Mais on constate que la clart6 des voix est bien davantage influenc6e par les m6mes conditions de distorsions : la diff6rence de la clart6 des voix due h la diff6rence des modes d'6mission (chuchotement et vocalisa- tion) varie nettement avec la distorsion de bande de fr6quence de coupure ; la diff6rence de quasi trente pour cent au d6part diminue avec la distor- sion, aboutissant ~ une diff6rence de quelques pour cent pour les distorsions d6passant le point de vall6e. La qualit6 des vocales bas6e sur l'identifi- cation des parleurs n'a qu'assez peu de valeur, la majeure partie n 'ayant pas 6t6 form6e par l'6mission vocalis6e. Par contre, la plus grande partie de la nettet6 des voyelles est sumsamment form6e par 6mission du chuchotement pour que l'6mission voca- lis6e n'am61iore que peu la qualit6. Bref, la nettet6 des phon6mes s'6tablit assez bien par 6mission souffl6e, mais la clart6 des voix ou des parleurs ne peut 6tre 6tablie par un simple souffle, et elle ne s'obtient que par une 6mission vocalis6e.

283 m

Page 8: Sur les qualités essentielles des vocales

8 / 1 6 Y. OCHiAI lET

4.2.3. Am61iorat ion des quaHtds vocales par adjonction de consonnes ant~cddentes.

Nous avons d6j~ expliqu6 que le jugement du timbre des voix est plus difllcile que celui des pho- nemes, et cette difficult6 est r6v616e par le fait que l'entralnement de l'6quipe pour la mesure de la qualit6 vocalique est beaucoup plus diflicile que pour la qualit6 phon6mique. Ceci r6sulte du fait que tous les moyens de jugement psychologique prove- nant des r6gimes transitoires des signaux et du timbre (c'est-h-dire de l'6tat d'attaque, d'une part,

%

t l Jill - - i . . . . . . . .

(~) . . . . -1 .~ . . .~ " , . . . - (/)H-I

I}1111

....:rl

'~ ii Ill, o,r 0~ o,3 o~ 0,7 go g , s 6 7 ke/~

Fro. 6 . - Repr6sentation de la variation des qualit6s res- peetives de net tet6 et de elart6, caus6e par la dif~6rence des modalit6s d 'existenee des vocales, e'est-h-dirc par la diff6renee entre les vocales ~mises d 'une mani~re isol6e et soutenue et les vocales combin6es avee des consonnes ant6c6dentes. La hauteur musicale des vocales est commu- n~ment choisie de 150 c /s soit pour les vocales isol6es soit pour les vocales combin6es. Dans cette repr6sentation, (i) signifie la caract6ristique des qualit6s des vocales iso- 16es, et (c) celle des vocales combin6es.

et de l'6tat d'extinction, d'autre part) sont enti~- rement exclus, et qu'il est seulement fair appel h notre jugement de la structure spectrale des signaux. Si l'on permet donc h ces r6gimes d'attaque et d'extinction d'intervenir pour la mesure des qualit6s du timbre, la valeur de la qualit6 vocalique sera 61ev6e d'une fa~on remarquable ; par suite la mesure de l'identification des voix deviendra plus facile. A plus forte raison, quand on utilise comme signaux un groupe de s6quence consonne + voyelle (CV), unit6 de combinaisons de sons tr~s naturelle en langue japonaise, la mesure de la qualit6 vocalique sera de plus eu plus facile, parce que les consonnes pr6c6dant les vocales contribuent au maximum l'am61ioration des qualit6s des vocales subs6quentes.

T. FUKUMURA [ANNALES DES TI~L~,COMMUNICATION$

Nous voulons donc examiner la diff6rence d'allure des caract6ristiques phon6mique et vocalique respec- tivement, diff6rence entraln6e par les consonnes ant6c6dentes. Ainsi : nous exarninons la diff6rence des qualit6s des ~Tocates en g6n6ral, selon que les vocales sont pr6c6d6es ou non par des consonnes quelconques. Autrement dit, nous envisageons ici la diff6rence de la qualit6 phon6mique des phon6mes et de la qualit6 vocalique des voix selon que les signaux sont pr6sent6s comme des s6quences de CV ou comme des V seulement.

Nous montrons dans les deux parties (a) et (b) de la figure 6 la diff6rence de qualit6 phon6mique et celle de qualit6 vocalique respectivement. Dans cette exp6rience participaient un ensemble de quatre voix (deux hommes, deux femmes) et une 6quipe de quatre auditeurs. Comme d'habitude, cinq voyelles japonaises I, E, A, O, U, sont employ6es. Comme hauteur musicale des vocales, la fr6quence de 220 c/s avait 6t6 choisie, car cette fr6quence 6tait cens6e 4tre moyenne : n'6tant ni trop haute pour les hommes, ni trop basse pour les femmes. Comme consonnes ant6c6dentes, toutes les consonnes sont utilis6es en langue japonaise d'une fa~on uniforme. Pour en d6terminer les caract6ristiques, on a ex6cut6 1200 observations dont les valeurs moyennes pour chaque condition de distorsion sont port6es sur la figure 6.

Les 6carts des caract6ristiques respectives (rela- tives, d'une part, aux qualit6s de la voyelle par adjonction de consonnes ant6c6dentes, d'autre part, auxqualit6s d'une seule voyelle isol6e), augmentent graduellement avec l 'augmentation des distorsions. Cette croissance des @arts existe 6galement en n'importe quelle qualit6 et dans n'importe quelle direction de distorsion. L'effet d'am61ioration des qualit6s des voyelles se manifeste d'une fa~on bien sp6cifique : les voyelles pr6c6d6es par les consonnes << r6agissent )) aux distorsions de suppression de bandes, et le taux de cette (( r6action )) apparalt de plus en plus fort au fur et h mesure que les distor- sions deviennent plus grandes, quand on prend en consid6ration comparativement les qualit6s des voyelles isol6es dans leur comportement vis-h-vis des distorsions des m4mes genres. Ce fait est observ6 taut pour la clart6 des voix que pour la nettet6 des voyelles, et pour la distorsion due hun filtre passe- bas tout comme pour la distorsion due h u n filtre passe-haut.

Mais si l'on y regarde de plus pr6s on peut remar- quer que le degr6 d'am61ioration de la clart6 est assez nettement plus grand que celui de la nettet6. [1 faut noter de plus que le point d'intersection reste presque invariable en d6pit de l'am61io- ration des qualit6s, ne changeant ni pour la nettet6 (1,3 kc/s) ni pour la clart6 (1,6 kc/s). Nous pouvons constater que le point d'intersection consi- d6r6 comme point de s6paration des domaines de qualit6s 6quivalentes est toujours assez stable mal- gr6 la diversit6 des allures des caract6ristiques et que sa position d6pend de la nature des qualit6s (le point

284

Page 9: Sur les qualités essentielles des vocales

t. 15, n~ 1960]

d'6galit6 des valeurs de nettet6 est toujours et incontestablement un peu plus bas que celui des quatit6s de clart6).

4.3. Bgsumg des r6sultats synthgtiques concernant le comportement de la qualitg phongmique et de la qualitd ~'ocalique dans les distorsions dues it la suppression de bande.

% 70a �84

8o

2 0

% 7a~

i 3o

g

2 0

0,?

,(b) o,2 o,3 o,s 0,7 1,o 2

SUR LES QUALITI~.$ E S S E N T I E L L E S DES V O C A L E S 9/t5

lisation sonore et, en outre, pr6c6d6es de consonnes quelconques. I1 est int6ressant de voir que les carac- t6ristiques des vocales isol6es et chuchot6es et les caract6ristiques des vocales combin6es et vocalis6es sont apparemment parall~les les unes aux autres. Dans le domaine born6 par ces deux paires de carac- t6ristiques, il y a une certaine r6gion (en fond gris6 sur la figure) o~ se placent de nombreuses paires de caract6ristiques des quallt6s correspondant aux vocales 6mises sur de nombreuses hauteurs tonales, exp6riences r6p6t6es bien souvent en changeant la combinaison de l 'ensemble des voix et l '6quipe des auditeurs. En empruntant des termes au calcul des probabilit6s nous dirons que la majorit6 des carac- t6ristiques des qualit6s des vocales aura le plus de chances de se placer sur cette surface en gris6, quelles que soient les hauteurs tonales et les inten- sit6s vocales des 6missions avec lesquelles les vocales exp6riment6es sont r igoureusement pro- nonc6es. On peut dire, inversement, qu'il y a peu de chances que les caract6ristiques des vocales 6mises

a r o c a s a o o o u o u c a u

i ! coup de cette r6gion en gris6, et cela quelles que soient les hauteurs et les intensit6s d'6mission sonore des vocales choisies.

Comme nous l 'avons dit au commencement de ce "F- paragraphe, la limite sup6rieure des qualit6s des

I voyelles coincide avec la caract6ristique des qualit6s " ' . des voyelles pr6c6d6es de consonnes, et sa limite

I inf6rieure coincide avec la caract6ristique des qua- lit6s des voyelles 6mises par chuchotement, sans v o i x ; par cons6quent, toutes les caract6ristiques

3 ~+ s 1 < r concevables concernant les qualit6s des voyelles 6mises individuellement et seules ~ l '6tat soutenu, sur tous l e s tons possibles dans la gamme des hau- teurs, et sur toutes les intensit6s possibles dans l 'intervalle dynamique, toutes ces caract6ristiques viennent se situer dans la r6gion convenable enca- dr6e par ces deux limites, sup6rieure et inf6rieure. Par comparaison avec la petitesse de l '6cart entre les deux limites de nettet6, l '~cart des caract6ris- t iques de clart6 est assez grand. Cet effet signifie que l 'influence globale des voix sur la nettet6 est rela- t ivement petite, tandis que l'influence synth6tique des voix sur la clart6 est assez grande. Cela est tr~s raisounable mais dolt etre str ictement et quant i ta- t ivement v6rifi6 par des exp6riences rigoureuses. I1 est tr~s f rappant de noter qu'en fonction de la clart6, la r6gion libre pour les caract6ristiques des voyelles isol6es et vocalis6es s '6tend presque diago- nalement dans la surface born6e par deux limites peu pros parall~les. Cet effet a lieu 6galement et 6vi- demment dans la distorsion de basse-coupure et dans la distorsicn de haute-coupure. A l'aide de cette repr6sentation synth6tique des qualit6s des vocales, nous pouvons plus ais6ment avancer dans l ' interpr6tation des ~c voix ~ et, par suite, nous pou- vons consid6rer d 'une fa~on plus ferme la technique de la transmission de l'616ment cc v o i x , dans la communicat ion des paroles.

FIG. 7 . - Repr6senta t ion la plus synth6t ique dcs qualit6s respectives de ne t te t6 des voyelles et de clart6 des parleurs don t les caract6ris t iques sont obtenues r e l a t ivement aux vocales isol6es ou combin6es, soit par vocalisat ion sur des hauteurs tonales diverses, soit par un seul soufflement. (a) repr6sente l 'ensemble des caract6rist iques de net tet6, et (b) l 'ensemble des caract6rist iques de clart6. Dans chaeune des deux repr6sentat ions, routes les caract6ris- t iques t o m b a n t dans la r~gion en gris6 sont eelles des qua- lit6s correspondant aux vocales 6mises par vocalisation sur des tons diff6rents et ~ des n iveaux vari6s ; chaque paire de caract6rist iques phon6mique et vocalique (en poiutill6) qui se t rouve $ la posit ion la plus hau te est celle donn6e par des vocales combin6es, et chaque paire de caract6ristiques se t r o u v a n t ~ la position la plus basse (en pointill6) et celle donn6e par des vocales chuchot6es.

~r Quand nous essayons~de r6sumer ce que nous

venons d'exposer, nous aboutissons aux donn6es des figures 7a et 7b off tous les r6suhats, syst6matique- ment et analyt iquement obtenus et v6rifi6s pendant de nombreuses ann6es, sont repr6sent6s d'une mani~re sommaire et condens6e. Dans ces deux repr6sentations (a) et (b) de la figure 7, les courbes les plus basses, en traits interrompus, correspondent aux caract6ristiques des qualit6s respectives des vocales 6mises solitaires et chuchot6es (par souffle) ; les courbes les plus hautes, aussi en traits interrompus, correspondent aux caract6rlstiques des qualit6s respectives des vocales 6mises par voca-

- - 285 - -

Page 10: Sur les qualités essentielles des vocales

~ 0 / ~ 5 Y . O C H I A I E T T, F U K U M U B A [ANNALI~S D~S T]~LI~COMMUNICATIOI~IS

5. B I ~ S U L T A T S D E S E X P I ~ B I E N C E S

U T I L I S A N T

D ' A U T I : t E S T Y P E S D E D I S T O B S I O N

Apr~s avoir fait les descriptions, g6n6rales et sp6cifiques, des qualit6s fondamentales dans la distorsion du type h 61imination de bande raise au service de l'interpr6tation du mode de la r6partition des qualit6s vocales en fonction de la fr6quence, correspondant h la structure d6taill6e du timbre des signaux vocaux, nous allons maintenant proc6der aux descriptions des qualit6s des vocales correspon- dant h des distorsions d'autres types, et cela h deux fins : d'une part, pour accentuer la diff6rence essen- tielle entre les deux qualit6s fondamentales, et, d'autre part, pour exposer d'autres caract~res impor- rants de ces deux qualit6s, mis en lumi~re seule- ment par application d'autres types de distorsion. La comparaison des r6sultats des qualit6s relatives deux distorsions diff6rentes est tr~s importante, du point de rue pratique, dans le probl~me g6n6ral off il s'agit de l'6valuation des syst~mes ou des proces- sus de transmission de la parole. Pour atteindre le premier but, nous utilisons uniquement la distor- sion cr66e par le d6faut de synchronisme (rotatoire) entre enregistrement et reproduction du magn6to- phone. Et pour le second but, nous employons la distorsion due h l'affaiblissement, i1 va sans dire qu'ici la distorsion de (< non synchronisation )). et la distorsion d'affaiblissement sont, routes deux, res- peetivement compar6es avec la distorslon de (< sup- pression de bande )) prise comme r6f6rence. D'abord nous d6crirons la caract6ristique des qualit6s r6pon- dant h la distorsion de synchronisme, nous repor- rant en m6me temps h la caract6ristique des qualit6s dans la distorsion de suppression de bande. Apr~s quoi, nous pr6senterons la description concernant les qualit6s fondamentales lorsque les phonemes sont soumis h la distorsion d'affaiblissement, pre- nant en consid6ration, en m6me temps, les qualit6s des vocales qui agissent sur la distorsion par sup- pression de bande, comme r6f6rence.

5.1. Des allures des qualit6s fondamentales de la distorsion de synchronisme comparfies aver eelles de la distorsion par suppression de bande.

Sur la figure 8, nous montrons respectivement (en a et b) les allures des caract6ristiques fondamen- tales, phon6mique et vocalique, des vocales r6pon- dant h la distorsion de synchronisme rotatoire entre enregistrement et reproduction, et les allures des m~mes qualit6s qui r6pondent h la distorsion par suppression de bande. Pour permettre des compa- raisons pr6cises et exactes, routes les conditions d'6mission des vocales ainsi que l'audition des signaux sont maintenues strictement identiques darts ces deux exp6riences : h l'6mission, les cinq voyelles prononc6es par les quatre voix masculines sur le ton de 140 c/s, au niveau d'intensit6 vocale

de mezzo-/orte, sont employ6es comme signaux de timbre caract6ris6 ; h la r6ception, une 6quipe de quatre auditeurs est employ6e 6galement dans les deux exp6riences. Tous les proc6d6s d'exp6rimen- tation demeurent identiques, except6 la diff6rence des distorsions utilis6es dans ces exp6riences. La prise de son pour enregistrer sur le magn6tophone est faite par un microphone h condensateur, et la repro- duction du son est effectu6e par un haut-parleur de bonne qualit6. Chacune des caract6ristiques est obtenue comme r6sultat d'un ensemble de I 200 ob- servations pour chaque condition de distorsion.

% too

~o

0,7 c~a

% Joe I i, �9 ,

8o I " " * "

2o

o4 o, a op

%

~o

~o

2O (o)

v,v o z,r 7,2 7,3 7~

hpport des r o t a t i o ~ %

!

Ill I IIIII 20 ~ q ' ~ do ooupu~

Fro. 8 . - Caract6ristiques de ne t te t6 et de clart6 dans la distorsion en synchronisat ion entre enregis t rement et reproduct ion (a) raises en comparaison avec les m6mes caract6rist iques darts la distorsion des bandes-coupures (b). La hau teur musicale des vocales est commun6ment choisie t40 c /s dans les deux distorsions. Darts ces deux repr6sentat ions, les courbes en t ra i t s pleins signifient la caract6ristique de net te t6 des voyelles et les courbes en t ra i ts coup6s signifient la caract6rist ique de clart6 des voix.

Sur les caract6ristiques de (( nettet6 des phonemes et de << clart6 des voix >) qui sont r6v616es par la dis- torsion de la bande, comme on le voit dans la repr6sentation de la figure 8b, il n 'y a rien de plus

dire que ceci: les allures des caract6ristiques, phon6mique et vocalique, qui sont obtenues avec les voyelles 6raises par les voix masculines sur le ton de 140 c/s au niveau de mezzo-/orte, sont les plus typiques ; les caract6ristiques de nettet6 se courbent d'une fa~on qui leur est propre ; les carac- t6ristiques de clart6 sont presque lin6aires en fonc- tion du logarithme de la fr6quence.

L'importance 6rant reconnue de l'6tude du mode

- - 286

Page 11: Sur les qualités essentielles des vocales

t. 15. n ~ 11-12, 1960]

de r6parti t ion des qualit6s dans la structure spec- trale du timbre, d'apr~s les caract6ristiques des qua- lit6s en fonction de la distorsion de bande, il faut signaler l ' importance encore plus grande de l '6tude du comportement des qualit6s quand les vocales sont soumises h la distorsion de t ransi t ion uniforme en fonction de la fr6quence, dfiment donn6e par la distorsion de synchronisme rotatoire. Pour tout ceci, nous sommes oblig6s de donner quelques brgves explications relatives h une 6tude que nous avons faite il y a d6jh six ans.

Comme nous l 'avons clairement constat6 dans l '6tude (( Timbre Study of Vocalic Voices )) [5], il y a deux types de formants : 1 ~ le formant que l 'on pent appeler proprement phondmlque, distribu6 d'une mani~re dense et compacte, uniquement et seulement concentr6 en quelques r6gions distinctes et diff6rentes suivant les phonemes ; les deux maxi- ma les plus importants de la structure de ce formant phon6mique sont d6sign6es par /1 et ]2 ; 2~ le for- mant r tel que nous l 'avons nomm6 ici, caract6ris6 par le mode de r6partit ion de sa qualit6 de structure relativement uniforme et fine, mais s'61argissant amplement vers le haut et vers le bas en fonction de la fr6quence ; les deux pointes qui se marquent fortement pour les voix des chanteurs professionnels, mais qui n'apparaissent que d'une mani~re mod6r6e pour les voix des profanes, sont d6sign6es par F 1 et F 2. En examinant les modules phon6miques et les modules vocaliques respecti- vement, nous avons pu d6couvrir un fait tr~s impor- tant , h savoir : au sujet de la structure du formant phon6mique, une tendance tr~s nette h la constance du rapport [1//~ ; en ce qui concerne la structure du formant vocalique, une tendance trgs f~appante h la constante du produit F 1 X 17 2. Mais une expli- cation d6taill6e serait n6cessaire. Les positions F 1 et F 2 dans la structure du formant vocalique pen- vent apparaltre diff6remment, suivant la variation des voix des parleurs ;ma i s les changements de F1 et de F2, caus6s par la diversit6 des voix, sont 6ta- blis de telle fa~on que leur produit reste presque invariable. De m~me, les positions /1 et [2 dans la structure du formant phon6mique des voyelles en g6n6ral, particuli~rement des voyelles ~ formants jumeaux (double-formant vowels en anglais), pen- vent varier, mais leurs changements sont asservis h une condition qui rend leur rapport presque constant pour un phoneme donn6 malgr6 la varia- t ion des parleurs.

Ces deux relations sont donc : l 'une, l 'invariabi- lit6 du rapport des deux fr6quences les plus remar- quables des maximums du formant phon6mique ; l 'autre, l 'invariabilit~ du produit des deux fr6quences correspondant aux deux points focaux dans la structure du formant vocalique.

Ces deux principes, qui r~glent la formation des structures spectrales, phon6mique et vocalique res- pectivement, ont 6t6 trouv6s dans l '6tude sur l 'ana- lyse objective des timbres phon6mique et vocalique. Autrement dit, ce sont deux principes vus d 'un cer-

SUR LES QUALITES ESSENTIELLES DES VOCALES i i / 1 5

tain angle d'observation physique. Pour le v6rifier et surtout pour le g6n6raliser, il est n6cessaire de l 'examiner d 'un point de vue subjectif. I1 faut donc passer de l 'aspect objectif h l 'aspect subjectif du probl~me. C'est pour cette raison que nous trai tons ce probl~me dans la mesure des qualit6s fondamen- tales.

Ce qui importe le plus dans la consid6ration de ces qualit6s, c'est de rechercher d 'abord quelle est la distorsion la plus nnisible pour des t imbres voea- liques off il y a invariabilit6 du produit F 1 • F2, d 'une fa~on qui soit sans effet sur les t imbres phon6- miques off l 'invariabilit6 existe dans le rapport /1l/2. Comme solution de ce probl~me, nous obte- nons la distorsion de transit ion uniforme en fonc- t ion de la fr6quence, qui est fournie ais6ment par l 'adoption de la distorsion de synchronlsme rota- toire entre enregistrement et reproduction. Par application de cette distorsion, les signaux sont tellement d6form6s que tons leurs composants sont d6plac6s simultan6ment et uniform6ment, soit vers le haut soit vers le bas en fonction de la fr6- quence, suivant la direction de la distorsion de synehronisne rotatoire. Sons l'influence de cette distorsion, le rapport original /1[/2 devient k/llk/2 dans le domaine des fr6quences hautes, ou de- vient (/l/k)/(/Jk) dans le domaine des fr6quences basses (k ou l ] k est le rapport des rotations) ce qui signifie qu'il n 'y a pas de diff6rence du fait de la distorsion en ce qui concerne le rapport des fr6- quences.

Au contraire, la valeur du produit F 1 X F 2 subit, peut-~tre, une influence assez sensible par cette distorsion de transition, parce que, apr~s avoir re~u la distorsion, cette valeur du produit devient k2. (F1 X F2) o u (ilk~). (F1 • F2) suivant la direc- t ion de transition.

Par d6coupage et 61imination des 616ments com- mandant le timbre, on pent causer une r6duction de nettet6 des voyelles, d 'une part, et la r6duction de clart6 des voix d 'autre part. Si l 'on pent donc, dans ce cas, d6terminer le degr6 de la d6formation et si l 'on pent mieux mesurer la d6t6rioration corr61ative des qualit6s, il est possible de faire correspondre les d6fauts des r6ductions des qualit6s, conform6ment au principe de notre 6tude.

Ce qui r6sulte de l'exp6rience de bande, c'est la notion de la qualit6 fractionnelle correspondant h la portion de t imbre : autrement dit, c'est la notion de la qualit6 diff@entielle d'ofi se d6duit la conception du mode de r6partit ion de la qualit6.

Par le processus de transfert des 616ments consti- tutifs du t imbre dans leur ensemble, les vocales sont plus ou moins affect6es d'une perte de qualit6. Ce que nous pouvons apercevoir par l ' introduction de cette distorsion de transition, ce n'est ni l ' informa- tion sur la qualit6 diff6rentielle n i le mode de r6par- t i t ion de la qualit6 en fonction de la fr6quence, mais c'est, h proprement parler, la connaissance du m6ca- nisme sur la coexistence des deux r6gions forman- tiques. Laissons de c5t6 tout ee qui n'est pas strir

- - 287 - -

Page 12: Sur les qualités essentielles des vocales

12/15 v. OCHIAI ET

tement n6cessaire et cherehons h parler ici seule- ment des r6gions formantiques. Si la condition de la coexistence est asservie seulement et purement h la relation de proportionnalit6 entre deux r6gions for- mantiques, autrement d i t si les deux r6gions for- mantiques sont eonditionn6es par leur intervalle seulement, la distorsion de transition uniforme ne peut exercer d'influence sensible sur l'6tablissement de 1cur qualit6 ; au contraire, si la condition de la coexistence s'6tablit relativement h la concurrence des deux r6gions formantiques, la distorsion de transfert uniforme peut incontestablement causer un effet assez efficace sur leur qualit6.

La figure 8a remplacera avantageusement une description d6taill6e de la solution pour la question pos6e ci-dessus. Cette figure montre avec 6vidence le fair suivant : la caract6ristique de nettet6 des phonemes (voyelles) peut supporter fortement une distorsion vers le haut ainsi qu'une distorsion vers le bas, tandis que la clart6 des voix (parleurs) ne supporte que faiblement cette m~me distorsion et montre une pente de m6diocre et presque constante d6croissance, mgme pour la distorsion la plus infime. E n d'autres termes, nous pouvons dire ; du point de rue de la nettet6 des phonemes, les vocales dans leur ensemble r6sistent h la distorsion de transition, mais ces mgmes vocales sont tr~s affect6es par la mgme distorsion en ce qui concerne la clart6 des voix.

I1 va sans dire que ces relations sp6cifiques de qualit6 pour les distorsions du type transitionnel ont des r6gions de distorsion propres et eonvenables o~ ces relations sont 6tablies avec une exactitude suffi- sante. Ce qui revient h dire qu'il y a des limites de distorsion ~ l'int6rieur desquelles s'6tablissent approximativement ces relations, limites qui sug- g~rent vraisemblablement l'existence de distorsions extrgmes tol6rables en ce qui concerne la perception des voeales, tant du point de rue de la nettet6 des phonemes que du point de rue de clart6 des voix.

5.2. De l'allure eomparde dans les qualitfis fondamentales des vocales clans la distorsion d'affaiblissement et dam la distorsion de irdquenee ( eoupure de bande ).

Quand on obtient une distorsion analogue ~ la dis- torsion de transition uniforme dans le terrain de la fr6quence, distorsion relative h l'influence de l'inten- sit6, on peut trouver la distorsion d'affaiblissement uniforme qui est juste compatible avec la distorsion de transition vers les basses fr6quences. Ce qui est compatible avec la distorsion de transition vers lesbasses fr6quences, c'est sans doute la distorsion due h l'accroissement ou h l'amplification uniforme, dont la description est mise de cbt6 pourle moment. La distorsion due h l'affaiblissement uniforme est, pour mieux dire, une sorte de distorsion dela transi- tion qui fait d6placer les signaux, simultan6ment, d'une mani~reuniforme et continue, relativement

leur structure en niveau d'intensit6. Cette dis- torsion due ~ la r6duction uniforme de niveau ne correspond pas h la distorsion de coupure des

T . F U K U M U R A [~..~NALI~S DES TI~LI~COMMUNICATi01~S

bandes basses, mais correspond plut6t h la dis- torsion de transition uniforme de fr6quence (*). C'est une remarque tr~s importante quand on pense

la nature essentielle de la distorsion. Mais, habi- tuellement, il n 'y a aucune n6cessit6 h faire une dis- tinction si stricte et si exacte. Sur la figure 9a, nous

% 700 ~ i . . . . . r ~ ' "

so Ii ~" i

60

0 70 2.0 .3o 4,0 50 ~o JB o/o

700 I ~ - 7 - - ".~l-i~--, I 3-1 i [ . . . . . [ , .-r . . . . . . . I

zO I L_Li_~Z' . .~ , , , . ,~__L~<[ . ~'l L t I I I [ I

~ L. I I tl.Zll! I I f l I I I / } ,Nlflll l, +iiil , rl l I '1 l

0,7 @2. 0,3 O~E gT, 7,O g5 e d '~ S ~ 7 kel~

W'.".T.,,~,.o c~ r

FIG. 9 . - - C a r a e t 6 r i s t i q u e s de ne t te t6 et de clart6 dans la distorsion d'affaiblissement, mises en comparaison avec les caract6ristiques de ne t te t6 et de clart6 darts la distorsion des bandes-coupures. Les courbes en t ra i t s pleins pr6sen- t en t les caract6rist iques de clarl6 des v o i x ; les courbes en pointill6 pr6sentent les caract6rist iques de la perte due

l'61ision des vocales assourdies en raison de la distorsion d 'affaibl issement et de la distorsion des bandes-coupures respect ivement .

montrons les caract6ristiques des qualit6s de nettet6 et de clart6 des sons vocalis6s isol6s qui sont soumis h la distorsion d'affaiblissement par un att6nuateur ordinaire. Pour en faire une comparaison exacte et pr6cise, nous donnons, sur la figure 9b, les caract6- ristiques de nettet6 et de clart6 des m~mes vocales isol6es dans la distorsion par filtre passe-haut. Dans les deux exp6riences d'affaiblissement et de filtrage des fr6quences basses, les conditions d'6mis- sion des vocales et d'audition des signaux sont maintenues strictement constantes: comme sons vocalis6s, nous employons cinq voyelles 6raises par quatre voix masculines sur le ton de 150 c/s et au niveau d'intensit6 vocate de mezzo- lor te ; eomme auditeurs, une 6quipe de quatre auditeurs est

(*) Ce qui correspond h la distorsion de eoupure passe- hau t en dimension de fr6quence, c 'est la distorsion due h l '6ergtage en intensit6.

288

Page 13: Sur les qualités essentielles des vocales

t. 15, n os 11-12, 1960]

employ6e. La prise de son pour l'enregistrement est faite par un microphone h condensateur, et la reproduction du son est effectu6e dans ce cas par quatre 6eouteurs du type 61ectrodynamique, d'excel- lente qualit6, au lieu du haut-parleur utilis6 dans les exp6riences pr6c6dentes. Le niveau pris comme r6f6rence, ou niveau z6ro, pour la pression acous- tique fournie par l'6couteur est choisi h 50 dB au- dessus du scull (point qui correspond h 50 pour cent d'audibilit6 en perception des vocales). On a pard- culi6rement veill6 h ce que les r6gimes transitoires, les parties d'attaque et d'extinction des signaux des vocales, soient d6coup6s et 61imin6s pour rendre les jugements de l'6quipe d'auditeurs autant que pos- sible r puts ~, au sens du timbre structural. Les valeurs de l'affaiblissement introduit dans cette exp6rience sont les suivantes : 0, 20, 30, 35, 40, 45, 50, 60 dB ; et les conditions de coupure de filtre sont : 0,4, 1,0, 1,5, 2,5, 4,0, 6,0 kc/s. Pour chaeune des conditions d'exp6riences, un total de 2 000 obser- vations est pr6vu, et en nous basant sur les chiffres obtenus, nous avons pu dessiner des caract6ristiques tr~s r6guli~res, quoique la courbe de la clart6 s'6carte de celle de la nettet6 un peu plus que dans les exp6riences pr6c6dentes. Pour mieux expliquer la nature essentielle de la perte des qualit6s par la distorsion d'affaiblissement, nous ajoutons, sur les figures 9a et 9b respectivement, une courbe (en traits pointill6s) qui correspond directement h la perte pure des signaux se trouvant assourdis par l'appauvrissement des sons att6nu6s. En traeant comparativement les deux caract6ristiques, de la perte de nettet6 d'une part, et de la perte due h l'6lislon des vocales d'autre part, nous pouvons als6ment nous rendre compte sur la figure 9a que, pour la plus grande part, la perte de nettet6 cons6- cutive h l 'att6nuation des vocales est dOment et directement attribuable h l'61ision des vocales par l'appauvrissement des sons. Nous constatons au contraire, dans le cas de la distorsion par filtres passe-bande, que la perte de nettet6 due h l'61ision des vocales ne compte que pour une assez petite part, comme le montre clairement la figure 9b.

Quand on examine la forme des caract6ristiques de ces qualit6s, en distorsion d'affaibllssement, on volt imm6diatement que la caract6ristique de la nettet6 est constitu6e approximativement de trois parties distinctes : la premiere est la pattie horizon- tale, c'est-h-dire h peu pros invariable en d6pit de l 'augmentation de la distorsion, qui s'6tend de la valeur 0 dB h la valeur 30 dB de l'affaiblissement ; la seconde est la pattie tr~s courte mais tr~s variable h courbure accentu6e qui correspond aux valeurs d'affaiblissement comprises entre 30 et 40 dB ; la troisi~me partie, s'6tendant dans l'intervalle de 40 h 60 dB prend une forme presque droite et d6croissante. Quant h la caract6ristique de clart6 des voix, elle est remarquable par sa forme qui varie continuellement d'une far uniforme, pr6sentant ainsi au d6but une pente tr~s douce, puis une incli- naison graduellement et continuellement variable.

SUR LES QUALITES ESSENTIELLES DES VOCALES 13/15

En comparant maintenant attentlvement ]es caract6ristiques dont nous venons de parler avec celle de la distorsion par filtres passe-bande, on peut y apercevoir beaucoup de ressemblance assez apparente des unes avec les autres. Par exemple, quand on consid~re la similitude entre elles simple- ment du point de rue de la pente des caract6ris- tiques, la distorsion de coupure basse-l~as de ~,5 kc/s correspond approximativement h la distorsion d'affaiblissement au niveau d'environ 35-40 dB. Autrement dit, le degr6 de qualit6 des vocales atteint pour une fr6quence voisine de ~t,5 kc/s 6quivaut approximativement au degr6 de la qualit6 donn6 par un affaiblissement d'environ 35-40 dB. L'unique diff6rence de forme entre les deux carae- t6ristiques de clart6 des voix est qu'il existe un certain point de croisement dans la distorsion de bande, et qu'il n 'y a rien de tel dans la vocale de distorsion d'affaiblissement.

FIG. 1 0 . - Repr6sentat ion de la caract6rist ique de ne t te t6 (en 1fairs pleins) et de la caract6rist ique de clart6 (en t ra i ts eoup6s) dans la distorsion de coupure passe-haut et dans la distorsion de coupure passe-bas oil, en ordonn6es, sont port6es l ' a t t6nua t ion 6quivalente pour la ne t te t6 (en dB) au lieu de la valeur du pourcentage de net tet6, et l ' a t - 16nuat.ion 6quivalente pour la clart6 (en dB) au lieu de la valeur du pourcel~tage de clart~.

Maintenant que nous venons d'eflleurer le pro- blame d'6quivalence des deux distorsions, nous devons traiter ce probl~me d'un point de rue plus essentiel, parce qu'au stade pr6sent du d6velop- pement technique de la t616phonom6trie, la distor- sion d'affaiblissement a le r61e de distorsion der6f6- rence pour l'estiInation des syst~mes de transmission de la parole. Qu'il s'agisse de la m6thode d'estima- tion ant6rieure du S. F. E. R. T., ou de la m6thode actuelle de I'A. R. A. E. N., on trouve h la base le principe d'~quivalence pour la nettet6 entre les dis- torsions de diff6rents types, et surtout la r~gle de prendre la distorsion d'affaiblissement comme dis- torsion principale.

Pourquoi utilise-t-on cette distorsion d'affaiblls- sement comme r6f6rence ? C'est, sans aucun doute, parce qu'elle est plus ais6ment reproductible. En conformit6 avec cette technique d'estimation des qualit6s, nous conduisons notre 6rude en donnant un exemple dans lequel il s'agit d'obtenir l'6qui-

289

Page 14: Sur les qualités essentielles des vocales

14 /~ .5 Y. O E n I A I ET

valence entre distorsion par suppression de bande et dlstorsion d'affaiblissement.

Supposons maintenant que nous puissions utiliser les caract6ristiques donn6es dans les deux parties (a) et (b) de la figure 9. E t supposons encore que, non seulement l '6quivalence de la nettet6, confor- m6ment h la prat ique routini~re, mais aussi une 6quivalence de la clart6 tout h fair in6dite et incon- nue, soient ~ d6terminer.

Sur la figure i0, nous pr6sentons les allures des caract6ristiques de nettet6 des voyelles et de clart6 des volx avec des filtres passe-haut off les quali- t6s exprim6es en ordonn6es ne sont port6es ni par la valeur en pour-cent de nettet6 ni par la valeur en pour-cent de clart6, mais sont expri- m6es respectivement par l 'affaiblissement 6quivalent pour la nettet6 et par l 'affaiblissement 6quivalent pour la clart6. La conversion du pourcentage des qualit6s en affaiblissement 6quivalent est ex6cut6e facilement en utilisant les deux parties (a)et (b) de la figure 9.

Le simple examen de la figure 10 nous montre que l 'adoption de l 'affaiblissement 6quivalent n 'apporte aucune am61ioration pour la repr6sen- ration de la nettet6 qui reste encore invariablement d 'une forme compliqu6e, tandis que cette adoption apporte 6videmment une simplification tr~s frap- pante h la forme de la caract6ristique de clart6 des voix soit dans la distorsion de fr6quence par filtre passe-haut soit dans la distorsion par filtre passe-bas.

Pourquoi donc, seule, la qualit6 de clart6 peut- elle ~tre si simplifi6e qu'elle puisse ~tre repr6sent6e par une ligne droite sous forme d'affaiblissement 6quivalent, en adoptant l'6chelle logarithmique pour les fr6quences de coupure ? Pour r6pondre h cette question, nous devons nous appuyer premi~rement sur la notion de clart6 qui convient le mieux h notre but, et secondement sur la convenance de la distor- sion d'affaiblissement comme r6f6rence au point de rue pratique.

D'apr~s ce que nous avons d6jh montr6, la qualit6 de clart6 des voix apparalt assez uniform6rnent et simplement distribu6e, quand on la repr6sente en fonction de la fr6quence (exprim6e en 6chelle loga- rithmique), mais aussi en fonction du niveau d'inten- sit6 (exprim6 en unit6s logarithmiqucs dB). Quant h la qualit6 de nettet6 des phonemes, nous devons trouver le contraire : on sait que cette qualit6 de nettet6 est excentrique darts le mode de distribution ; que ce soit en fonction de la fr6quence, que ce soit en fonction de l 'intensit6, la distribution de valeur et de nettet6 est si dense en certaines r6gions que son allure comme qualit6, rant dans la distorsion de fr6quence par suppression de bande que dans la distorsion d'affaiblissement, devient tr~s compliqu6e.

6. D I S C U S S I O N .

La parole, en g6n6ral, et la voix parl6e en par- ticulier, peut avoir deux qualit6s fondamentales au moins, la qualit6 phon6mique et la qualit6

T. F U K U M U R A [ANNALES DES TI~L~COMMUNICATIONS

vocalique, que l'on peut appeler si l 'on veut, ~c nettet6)~ et ~c clart6 )) ; ce fait est tr~s 6vidcnt et bien connu. Mais, quand on tente de le v6rifier plus posit ivement en lui donnant une base solide, on peut se heurter h u n obstacle qu'il est tr~s difficile de surmonter. C'est que, t an t qu'on reste au stade de l'id6e simple ou de sens commun, on salt bien que la qualit6 vocalique existe en dehors de la qualit6 phon6mique. Mais quand on r6fl6chit sur la subs- tance et sur la nature v6ritable des langues parl6es, il faut bien se rendre compte que, tout au moins au sujet de l 'art iculation r6elle des voyelles ou des vocales, l 'une ne peut ~tre produite sans l 'accompa- gnement de l 'autre et vice-versa. Le probl6me qui se pose n'est pas un probl6me de finesse ou de pr6ci- sion des appareils de mesure utilis6s pour les exp6- riences, mais plut6t le probl6me fondamental relatif h la m6thode suivant laquelle on peut conduire l'ex- p6rimentation sur les c~ qualit6s ~. I1 y a longtemps que nous avons eu le dessein de nous assurer de l 'exactitude stricte de l 'hypoth~se que nous avons form6e sur ce point ; cela nous a conduit h la seule exp6rimentation que nous avons d6crite.

Apr6s avoir ex6cut6 cette suite d'exp6riences sur les qualit6s des vocales, nous pouvons constater non seulement que notre conception des qualit6s n'est pas erron6e et que notre plan et notre sch6ma d'exp6riences sont acceptables, mais aussi qu'il y a encore beaucoup de fairs tr~s int6ressants et mgme 6tonnants dans cette 6tude des qualit6s, parce que leur domaine n'est encore qu'insuffisamment explor6, malgr6 son importance dans les sciences et tech- niques de la transmission de la parole.

Quoi qu'il en soit, nous ne pouvions dans cet expos6 d6crire en totalit6 et en d6tail nos exp6- riences sur les qualit6s. Nous avons expos6 ici seu- lement l 'exp6rimentation la plus g6n6rale et la plus fondamentale des caract6ristiques de la qualit6 de nettet6 des phonemes, d 'une part, et de la qualit6 de clart6 des voix d 'autre part. Au stade de notre connaissance initiale, l'essentiel, qul est h la fois n6cessaire et suffisant, est de mettre en lumi~re d'abord la diff6rence qui s6pare les deux qualit6s, la phon6mique et la vocalique, puis la relation r6ci- proque qui existe entre elles, en employant certaines distorsions appropri6es. Les 6tudes approfondies et d6taill6es sont laiss6es pour plus tard. C'est pour- quoi nous avons indiqu6 la diff6rence la plus frap- pante et la plus saisissante des allures des caract6- ristiques phon6mique et vocalique, laissant de c6t6 tous les d6tails sur les confusions des phonemes et des voix, qui, peut-gtre, permet tent d'interpr6ter les allures de d6croissanee ou de d6ficience des qua- lit6s respectives.

Apr~s avoir achev6 l '6tude des qualit6s qui nous r6v~lent comment s'6tablissent diff6remment la qualit6 de nettet6 et la qualit6 de clart6 en fonction de la fr6quence, en se fondant sur la m~me structure des fr6quences composantes, nous sommes amen6s h nous int6resser h la troisi~me qualit6, c'est-h-dire t~ l 'intensit6 sonore subjective (sonic, ou ~ loudness ~

290

Page 15: Sur les qualités essentielles des vocales

t . 15, n ~ 11-12, 1960]

en anglais) des vocales. Comment donc cette qualit6, l 'intensit6 sonore, peut-elle se d6terminer en fonction de la fr6quence ? Peut-elle avoir un mode de r6par- t i t ion tout diff6rent de celui des r6partitions de la clart6 et de la nettet6 ? Nous trouvons une source d'int6r~t in6puisable dans ce probl~me de l'inten- sit6 acoustique subjective eompar6e et associ6e avec les autres qualit6s de clart6 et de nettet6. Par l '6tude de ces comparaisons r6ciproques, leurs caract~res propres deviennent plus nets. M6me le caract~re de nettet6, qui est cens6 ~tre d6jh connu h fond, devient beaucoup plus clair grfice h la comparaison avec la qualit6, subordonn6e ou subsidiaire, de l ' intensit6 sonore: non seulement la propri6t6 de l 'intensit6 sonore des vocales devient plus compr6- hensible, mais aussi les natures m6mes des deux qualit6s fondamentales du timbre, nettet6 et clart6, deviennent de plus en plus claires. Nous avons d6jh fait eette exp6rience compl6mentaire sur l 'intensit6 sonore. Nous nous proposons d'en pr6senter ult6- rieurement les r6sultats.

7 . C O N C L U S I O N .

D'une s6rie d'exp6riences ex6cut6es pendant plu- sieurs ann6es, nous pouvons d6duire les faits sui- r an t s :

to la caract6ristique de nettet6 des voyelles est tout h fair diff6rente de la caract6ristique de elart6 des voix. Ce fair est confirm6, soit par l ' introduetion de la distorsion des filtres de bandes, soit par l'utili- sation de la distorsion de (( synehronisation rota- toire )) entre enregistrement et reproduction, t au t pour n ' importe quel ensemble de parleurs que pour n ' importe quelle 6quipe d 'auditeurs ;

20 l'allure des earact6ristiques de qualit6 dans la distorsion par coupures de bande nous permet de supposer que le mode de distribution de la qualit6 entre les gammes de fr6quenee est essentiellement diff6rent suivant la nature de eette qualit6 : la nettet6 des phonemes montre une distr ibution tr~s typique et excentrique, avec une densit6 brusque- ment et rapidement variable en fonction de la fr6- quenee ; la elart6 des voix, au eontraire, montre une distribution eompos6e de deux parties : une partie haute et une partie basse, avee un mode de r6par- t i t ion eomparat ivement uniforme et simple dans chaeune de ees parties ;

3 ~ par utilisation de la distorsion de synchroni- sation, qui fait subir aux signaux du t imbre un transfert d'ensemble uniforme (proportionnel) dans le domaine des fr6quences, on peut affirmer que cette distorsion n'apporte aux vocales qu 'une influence insignifiante du point de vue de la nettet6, mais on peut encore davantage affirmer que eette distorsion peut avoir, au contraire, sur la qualit6 de clart6, une influence notable, hors de proportion avee le degr6 de transfert ;

4 ~ en employant la distorsion d'affaiblissement, nous pouvons constater que la (( clart6 )) porte sa marque, m~me dans la distr ibution en fonction de

S U n L E S QUALITIES E S S E N T I E L L E S D E S V O C A L E S 15/15 l 'intensit6, h savoir d'6tre aussi uniforme et simple dans cette distribution que dans la distribution en fonction de la fr6quence ;

5 ~ le fait que la clart6 des voix ait un caract~re uniforme et simple dans sa distribution, rant en fonc- t ion de la fr6quence qu'en fonction de l 'intensit6, est d ' importance essentielle, particuli~rement pour le probl~me pratique de l '6valuation des syst~mes de communication, il en r6sulte essentiellement qu'il convient d'6viter l 'adoption de la qualit6 (( nettet6 7), qui est une fonction tr~s compliqu6e aussi bien de la fr6quence que de l 'intensit6, et d 'adopter comme qualit6 de base la (c clart6 )) (des voix), qui est beau- coup plus simple et uniforme dans sa distribution, t an t dans la gamme des fr6quences que dans l'6chelle des intensit6s ;

6 ~ par conversion r6ciproque des qualit6s entre distorsion de fr6quence et distorsion d'affaiblisse- ment, nous pouvons illustrer actuellement la pr6do- minance de la clart6 sur la nettet6 pour le probl~me d'estimation.

Manuscrit refule 15 septembre 1959.

Remerciements. --Cette ~tude a dtd [aite, pour moitid grdce au Fonds d'Encouragement pour les Becherches Scientifiques du Ministdre de l'Enseignement Public du Japon, pour moitig comme gtude spgcifique sous la /orme de recherche imposde par le Laboratoire de Tdlgcommuni- cation de l'Administqation Publique des Tgl@raphes et T~l@hones du Japon. Nous demons leur exprimer notre pro/onde reconnaissance pour nous avoir /ourni les /onds et les occasions de/aire notre recherche au cours de si longues anndes.

BIBLIOGRAPHIE

[l] OcmAi (Y.), M6moire sur les sons des voix humaines. M F E (Memoirs o/ the Faculty o/ Engineering), Nagoya Univ., (July, t952), vol. 4, n ~ 1, pp. 83-86.

[2] OcmA~ (Y.). Transmission of quality. (Transmission de la qualit6.) MFE, Nagoya Univ., (nov. 1954), vol. 6, n ~ 2, pp. 207-216.

[3] OcmAI (Y.) and YAMASHITA (T.). On timbre qua- lity. (Sur la qualit6 du timbre.) MFE, Nagoya Univ. (May, 1955), vol. 7, n ~ 1, pp. 66-71.

[4] OcmAi (Y.) and FUKUMURA (T.). On the fundamen- tal qualities of speech in communication. (Sur les qualit6s fondamentales de la parole dans les com- munications.) J. acoustic. Soc. Amer. (t957), vol. 29, n ~ 1.

[6] OCHIAI (Y.) and FVKUMURA (T.). Timbre study of vocalic voices. (Etudes du timbre de voix voealiques). MFE, Nagoya Univ. (sept. 1953), vol. 5, n ~ 2, pp. 253-280.

[71 OCU,A, (Y.) and FuxuMvnA (T.). Introductory to timbre study of forced vocalies. (Introduction l'6tude du timbre des voealiques forts.) MFE, Nagoya Univ. (nov. 1957), vol. 9, n ~ 2, pp. 316- 320.

[5] OCHIAI (Y.) and FUKUMURA (T.). Timbre pattern representation and subjective quality measure- rement of forced vocalics. (Representation de type de timbre et mesure de la qualit6 subjective des types vocaliques forts.) (Unpublished.)

[8] OcmA~ (Y.). Prineipes fondamentaux des qualit6s phon6mique et vocalique des paroles par rapport au timbre, obtenues en employant des voyelles japonaises vocalis6es par des sujets japonais. MFE, Nagoya Univ. (nov. 1958), vol. t0, n ~ 2, pp. 197-201.

- - 2 9 1 - -