Sommaire
Les langues les plus difficiles à apprendre pour les anglophones
Les apprenants de langues se posent souvent la question : « Quelle est la langue la plus difficile ? » Une recherche à ce sujet sur Google génère des millions de résultats renvoyant à des listes qui restent finalement subjectives, car la difficulté d’une langue dépend fortement du parcours linguistique de chacun. De plus, la plupart des listes s’appuient largement sur la classification de difficulté linguistique établie par la CIA, qui ne répertorie que les principales langues mondiales selon les intérêts de l’agence.
Les langues de catégorie III et IV de la CIA sont indéniablement difficiles. Cependant, il existe de nombreuses ressources et locuteurs natifs pour aider les apprenants à s’entraîner. Nombreux sont les langues moins connues et menacées qui, elles aussi, se révèlent incroyablement complexes, mais qui ne disposent pas de la même reconnaissance ou des mêmes ressources d’apprentissage. Une liste devrait donc inclure un mélange diversifié de langues mieux connues, ainsi que quelques-unes des langues plus difficiles et moins connues. Dans ce contexte, voici quelques-unes des langues les plus difficiles à apprendre pour les anglophones, qui rendent la liste de la CIA presque enfantine.
Chinois
La langue chinoise est souvent perçue comme un véritable défi pour les apprenants. Cependant, selon l’université de Warwick, elle est en fait l’une des langues les plus simples à maîtriser, au moins du point de vue grammatical. En effet, le chinois ne possède ni verbes conjugués, ni temps, ni verbes irréguliers, ni distinctions de genre ou de nombre pour les noms et les adjectifs, ni articles, ni pluriels, ni un ordre des mots étrange. L’ordre des mots — sujet-verbe-objet — est d’ailleurs identique à celui de l’anglais.
Alors, d’où provient cette réputation légendaire de difficulté ? En négligeant l’écriture, qui bien qu’elle soit complexe, n’est pas nécessaire pour parler, le défi réside dans le fait que le chinois est une langue tonale. Les mots chinois sont principalement monosyllabiques, ce qui permet de les combiner pour former des mots plus complexes. Cependant, pour compenser cette simplicité phonologique, des tons sont utilisés pour différencier le sens des mots. Ainsi, comme le souligne ThoughtCo, une variation de ton peut transformer le mot « ma » pour signifier « cheval », « mère », « chanvre » ou « gronder ».
Bien que les étudiants puissent différencier les tons en classe, leur utilisation correcte dans des conversations quotidiennes s’avère bien plus difficile. Par exemple, des chercheurs ayant étudié des étudiants sri-lankais ont constaté que les étudiants sinhalais imposaient les inflexions tonales de leur langue sur le chinois, ce qui pouvait conduire à des problèmes de prononciation. Ainsi, maîtriser le chinois exige une pratique quotidienne et des échanges avec des locuteurs natifs pour saisir les subtilités de la phonologie chinoise. En revanche, l’apprenant capable de maîtriser les tons trouve un chemin relativement facilité vers la maîtrise, car les bases de la langue sont très simples.
Le polonais
Les langues slaves sont classées comme des langues de catégorie III par la CIA, ce qui inclut des relations indo-européennes plus éloignées de l’anglais. Parmi celles-ci, le polonais se distingue comme l’une des langues les plus difficiles pour les anglophones, en raison de sa grammaire complexe et d’une prononciation redoutable qui impose un vrai défi aux apprenants.
Les consonnes polonaises et leurs regroupements posent de réels casse-têtes. Un célèbre virelangue polonais, utilisé pour mettre les étudiants à l’épreuve, énonce : « W Szczebrzeszynie chrząszcz brzmi w trzcinie. » Cela illustre à quel point le polonais peut combiner une multitude de consonnes. En outre, des consonnes comme dź, ź, ś et ć, qui n’apparaissent pas dans d’autres langues slaves, complexifient encore plus l’apprentissage. Ces sons exigeants nécessitent un placement spécifique de la langue, très éloigné des phonèmes familiers aux locuteurs anglophones.
La grammaire polonaise ressemble généralement à celle d’autres langues slaves, mais introduit aussi le concept de virilité. Selon l’Université du Michigan, le polonais établit une distinction entre les noms masculins grammaticaux (comme « chien ») et les noms masculins biologiques (comme « homme »), chacun prenant des terminaisons distinctes au pluriel. Ainsi, « pies » (chien) devient « psy », tandis que « mąż » (homme) se transforme en « męzi ». En raison des règles complexes liées à la virilité, les apprenants polonais tendent à étudier le pluriel de base en dernier, ce qui démontre la profondeur des défis que cette langue présente.
Le Finnois
Le finnois est une langue classée dans la catégorie III par la CIA, tout comme ses langues apparentées, l’estonien et le hongrois. Bien que cette langue soit très logique et directe, dépourvue de genre et d’articles, elle présente des défis majeurs pour les apprenants. En effet, le finnois fait partie des langues ouraliennes, en lien avec les langues de Sibérie, du nord de la Russie et de Scandinavie. Ainsi, les élèves ne peuvent pas s’attendre à trouver des similarités avec l’anglais en ce qui concerne le vocabulaire ou la grammaire, qui diffère considérablement de la grammaire anglaise relativement simple.
Selon le manuel linguistique Morphologie, le finnois possède 15 cas grammaticaux exprimés par des terminaisons, qui décrivent les rôles des noms, des adjectifs et des pronoms dans une phrase. Par exemple, le mot « talo » (maison) devient « talon » (de la maison) ou « talossa » (dans la maison). Heureusement, il existe un seul ensemble de terminaisons qui s’applique à tous les mots. Cependant, selon Stanford, la réelle difficulté dans les noms finnois réside dans la gradation des consonnes, un phénomène qui décrit des changements apparemment arbitraires dans certaines terminaisons de mots dont les racines se terminent par k, p ou t. Ainsi, « halko » (bûche) devient « halon » (de la bûche) au lieu de « halkon », tandis que « suku » (parent) devient « suvun » (de la parenté).
De plus, This is Finland souligne qu’une fois qu’un apprenant a consacré tous ses efforts à apprendre le finnois standard, il doit également assimiler le finnois parlé, qui diverge de la langue écrite. Donc, bien que la grammaire finnoise puisse sembler cohérente dans un cadre académique, son utilisation dans une conversation quotidienne, qui contourne bon nombre des règles strictes, représente un défi unique. Au moins, elle utilise l’alphabet latin.
Lituanien
Le lituanien, classé dans la catégorie III par la CIA, fait partie du groupe balte de la famille des langues indo-européennes. Selon le Lithuanian Quarterly Journal of Arts and Sciences, cette langue occupe une place spéciale au sein de cette famille en raison de son caractère archaïque, ayant préservé une variété de déclinaisons, de vocabulaire et de formes que l’anglais a abandonnées. De ce fait, elle présente une forte ressemblance avec d’anciens langages indo-européens tels que le latin et le sanskrit, mais elle est sans doute plus complexe que ces deux-là.
La difficulté du lituanien commence avec un système de cas compliqué, rempli d’exceptions, et une accentuation libre (l’accent peut se poser sur n’importe quelle syllabe). Par ailleurs, selon le professeur Olegas Poliakovas de l’Université de Vilnius, le vocabulaire lituanien a changé relativement peu par rapport au proto-indo-européen, la langue ancestrale hypothétique de toutes les langues indo-européennes. Ainsi, bien que le mot lituanien « avis » signifie « mouton », il faut connaître le terme anglais obscur « ovine » pour établir cette connexion, car l’origine des mots en anglais est différente.
Le Lithuanian Quarterly Journal of Arts and Sciences souligne également que les participes constituent un autre obstacle. Le lituanien compte au total 13 participes pouvant chacun prendre l’une des 24 formes selon leur rôle dans une phrase. À titre de comparaison, l’anglais n’a que deux participes, à savoir le présent et le passé (« doing » et « done », par exemple). Toutefois, cela simplifie les choses d’une certaine manière. Le lituanien peut exprimer l’idée de « celui qui avait travaillé » en un seul mot : « dirbęs ».
Arabe
La langue arabe jouit d’une grande renommée en tant que langue liturgique de l’Islam et lingua franca d’une grande partie du Moyen-Orient. Pour ceux qui ne sont pas natifs, elle représente un véritable défi. Selon l’Université de Warwick, l’arabe, à l’instar de toute bonne langue sémitique, assemble logiquement les mots à partir de racines consonantiques de trois lettres, auxquelles sont ajoutées des voyelles. Par exemple, dans le corpus coranique, la racine k-t-b, associée à l’écriture, produit des formes telles que « kitab » (livre), « katab » (écrire) et « maktab » (école/bureau), ainsi que de nombreuses formes verbales. Bien que le vocabulaire soit relativement simple à dériver et à reconnaître, la multitude de formes peut sembler intimidante.
Les verbes arabes peuvent paraître extrêmement complexes. Alors que l’anglais utilise plusieurs verbes et constructions pour des notions telles que la voix passive ou des actions réciproques, l’arabe exprime ces concepts avec des verbes spécifiques dérivés de son système de racines. Il existe 10 types de verbes, comme l’illustre la thèse de Dr. Abdallah Alshdaifat sur « La formation des dérivés nominaux dans la langue arabe ». La signification des formes verbales dépend des préfixes et des infixes ajoutés à la racine trilittère. Par exemple, en transformant le verbe « katab » (écrire) en sa forme réciproque « takātaba », la signification change en « correspondre ». Généralement, ces significations se rapportent à la racine originale, ce qui rend l’arabe assez logique à cet égard. Cependant, cela peut sembler déroutant pour les non-initiés. Heureusement, la YouTbeuse et locutrice natif de l’arabe, Loubna Duymayan, vulgarise également ces concepts pour un large public.
Le journaliste Marc Simmons, de Santa Fe New Mexican, se souvient de l’un de ses emplois d’été dans une mission navajo. À son arrivée, il a informé le pasteur de son intérêt pour l’apprentissage du navajo. La réaction du pasteur et de sa famille fut de rire, illustrant à quel point cette langue peut sembler inaccessible. Simmons fait référence au voyageur J.H. Beadle qui a déclaré : « Je me suis efforcé d’apprendre la langue, mais à la fin d’une journée de dur labeur, je n’avais maîtrisé que deux mots. »
La difficulté du navajo commence par sa phonologie, que Beadle a jugée « inaccessible à tout alphabet des civilisés. » D’après le guide de phonologie de l’Université de Swarthmore, cette affirmation trouve sa source dans les spécificités de la langue. Le navajo compte quatre tons, des coupures glottales fréquentes (le son entre « uh » et « oh » dans « uh-oh »), et de nombreux sons sans équivalent en anglais. Des paires de consonnes telles que b et p ou t et d sont identiques à l’oreille non entraînée, mais peuvent distinguer des mots différents.
Selon le journal Coyote Papers de l’Université de l’Arizona, les verbes navajos représentent le plus grand défi. Ils différencient les actions qui sont présentes, continues, répétées une fois ou plusieurs fois. Il existe même une forme distincte appelée « semelfactive », qui se réfère à une itération particulière d’une action répétée. Ainsi, il est dit que si le navajo n’est pas appris pendant l’enfance, il est presque impossible d’atteindre une fluidité fonctionnelle, particulièrement pour les locuteurs de langues indo-européennes éloignées et non apparentées comme l’anglais.
En raison de sa complexité, le Musée national de la Seconde Guerre mondiale note que les célèbres Code Talkers navajos ont utilisé cette langue durant la Seconde Guerre mondiale pour transmettre des messages classifiés.
Circassien
Le linguiste Louis Loewe raconte qu’un érudit ottoman a autrefois voyagé dans le Caucase pour enregistrer les langues locales, où il a rencontré le peuple circassien. À son retour, le sultan lui a demandé à quoi ressemblait leur langue. L’érudit a alors agité un sachet de cailloux, ce qui fut la meilleure représentation qu’il pouvait fournir. Loewe a confirmé cette assertion, qualifiant le circassien de « l’une des langues les plus difficiles au monde ».
Cette anecdote apocryphe souligne la complexité des sons présents dans les langues caucasiennes. Selon l’étude Phonème et Morphème en Adyghe oriental, le circassien ne fait pas exception avec un impressionnant total de 52 sons. Parmi ceux-ci, pas moins de 49 sont des consonnes — le double des 24 en anglais — avec seulement trois voyelles. La plupart de ces sons n’existent pas en anglais et sont difficiles à reproduire pour les non-natifs. Il convient de noter que d’autres langues apparentées en Abkhazie possèdent plus de 60 sons.
En outre, la grammaire circassienne est souvent étrangère aux anglophones. Un manuel intitulé Grammaire du Kabardien décrit un type d’alignement grammatical différent, appelé ergativité. Par exemple, dans la phrase anglaise « la fille le sait », « la fille » est le sujet et « le sait » l’objet direct. Cependant, dans l’alignement ergatif, le sujet devient « le sait », tandis que « la fille » est l’agent. Ainsi, l’équivalent circassien « pśāśa-m mə-r ya-ś’a » serait mieux traduit en voix passive en anglais, ce qui peut dérouter les anglophones habitués à des constructions actives. Heureusement, ce principe ne s’applique qu’aux phrases avec un verbe transitif.
ǃXóõ
Bien que les langues du Caucase du Nord présentent des phonologies intimidantes, il existe des langues encore plus complexes. Vous pourriez vous interroger sur la signification de ǃXóõ. En effet, les points d’exclamation sont des marqueurs de phrase en anglais, et non des lettres. Pourtant, ce mot peu familier est le nom indigène de la langue Taa, l’une des nombreuses langues khoisan parlées dans le désert de Kalahari, au sud de l’Afrique.
La langue ǃXóõ est un véritable trésor. Selon le New York Times, il s’agit d’une langue à clics, comptant plus de 200 sons, selon certaines estimations. Cet important inventaire de consonnes provient des consonnes à clics. La langue possède cinq clics différents qui s’associent à des consonnes articulées pour former de nouveaux phonèmes. On ne sait pas pourquoi les langues khoisan ont conservé les clics alors que pratiquement toutes les autres familles de langues les ont perdues ; cependant, les linguistes suggèrent que cela compense un petit vocabulaire. Les mots en ǃXóõ sont courts, et les clics ont été innovés pour créer un inventaire phonémique plus conséquent et exprimer un vocabulaire plus vaste sans recourir aux homonymes.
Pour les anglophones, apprendre une telle langue implique littéralement d’apprendre à respirer différemment. Alors que la plupart des langues exigent d’expirer pour prononcer leurs sons, les consonnes à clics nécessitent que le locuteur inhale. Mais le locuteur doit ensuite expirer rapidement pour prononcer la voyelle suivante ou la consonne non-clique sans pause. Essayez de faire cela et constatez à quel point c’est difficile !
Inuktitut
Parlé dans l’Arctique canadien, l’Inuktitut est la langue du peuple inuit. Selon l’Encyclopédie canadienne, elle présente un défi particulier pour les anglophones à cause du phénomène de polysynthèse. Concrètement, la polysynthèse est une forme d’agglutination extrême, où des phrases entières en anglais peuvent s’exprimer par un seul mot en Inuktitut.
L’Inuktitut construit des mots en combinant des noms, des verbes et des suffixes. Les verbes sont conjugués en fonction de la personne et du nombre. Contrairement à l’anglais qui a trois personnes, l’Inuktitut en dispose de neuf. Cette spécificité s’explique par le fait que les pluriels inuits distinguent entre « deux personnes » et « trois personnes ou plus ». Par exemple, « nous deux » se traduit par « -gunnuk », tandis que « nous trois (ou plus) » devient « -gutta ». Ces éléments grammaticaux, ainsi que la plupart des autres, sont attachés aux mots au lieu de rester séparés. Les prépositions ou des expressions pour décrire des actions simultanées sont exprimées par des affixes, et le centre Pirurvik souligne qu’il y en a énormément.
Le résultat final tend à produire des mots très longs qui fonctionnent comme des phrases complètes en anglais. Ainsi, la phrase anglaise « Je suis allé chez mon frère ou ma sœur » devient en Inuktitut « nukakkutinnuulauqtunga ». Cependant, selon le magazine Canadian North, apprendre l’Inuktitut n’est pas si compliqué : il suffit de pratiquer.
Yoruba
Le Yoruba est une langue parlée en Afrique de l’Ouest, principalement au Nigeria. Selon le professeur Oluseye Adesola de Yale, dans son ouvrage Yoruba: A Grammar Sketch, la structure de construction des mots, l’ordre des mots et la grammaire générale de cette langue sont globalement sans particularité. Cependant, deux caractéristiques peuvent poser des difficultés aux anglophones : le système tonal et le système de comptage.
En tant que langue tonale, le Yoruba attribue un sens différent aux mots selon leur intonation, avec trois tons distincts. De plus, les mots en Yoruba sont généralement multisyllabiques, rendant une mauvaise prononciation d’une syllabe, même avec une seule tonalité incorrecte, susceptible de changer totalement le sens du mot. Par exemple, le mot igba peut avoir six significations différentes en fonction des tons utilisés sur les deux syllabes. Tout comme le chinois, il est une chose d’apprendre les tons en classe, mais les utiliser fluidement dans la conversation quotidienne peut véritablement déstabiliser un apprenant de cette langue qui n’est pas familier avec les inflexions du Yoruba.
Une autre caractéristique, véritablement fascinante, réside dans le système de comptage du Yoruba, qui crée des nombres à l’aide d’une structure de mathématiques internes. Ainsi, les nombres de 15 à 19 (et de 25 à 29, etc.) se forment par soustraction. Par exemple, le nombre anglais nineteen se dit en Yoruba « twenty lesser than one » (múọ̀kandίnnίogún). Pour les nombres de 11 à 14 (et de 21 à 24, etc.), l’addition est utilisée. Par conséquent, le nombre anglais twenty one se traduit par « Prendre un de plus sur vingt » en Yoruba (mọ́kànlélógún). Ainsi, les nombres en Yoruba peuvent sembler longs et complexes pour les anglophones, qui sont habitués à un système de comptage plus simple, avec seulement quelques exceptions dans les chiffres de la dizaine.
Silbo Gomero
Peut-on concevoir l’existence d’une langue non signée et non parlée ? L’île espagnole de La Gomera en est un parfait exemple avec la langue sifflée Silbo Gomero. Selon la linguiste russe Yana Schottenstein (via Omniglot), le Silbo Gomero remonte aux habitants pré-hispaniques Guanches des îles Canaries. Bien qu’on en sache peu sur eux, il est suggéré par Nature qu’ils ont des liens génétiques avec les Berbères d’Afrique du Nord, ce qui indique que leur langue pourrait également en faire partie.
Le Dr Schottenstein souligne que le Silbo Gomero a probablement été développé par les Guanches pour permettre une communication à longue distance à travers les vallées et ravins montagneux, où les cris pouvaient facilement être mal entendus. Aujourd’hui, cette langue s’est adaptée à la communication en espagnol. Selon la BBC, les sons de l’espagnol sont remplacés par quatre consonnes et deux voyelles sifflées, offrant une sonorité unique qui diffère des langues parlées et qui est produite par une combinaison de gestes des mains et de mouvements de la bouche.
Le Silbo Gomero avait chuté dans l’oubli, notamment lorsque beaucoup d’insulaires de La Gomera ont migré vers l’Espagne et l’Amérique latine à la recherche de travail. Toutefois, il connaît aujourd’hui un renouveau. La BBC mentionne que dans les zones dépourvues de service téléphonique, notamment en cas d’urgence, le Silbo Gomero constitue un moyen idéal pour communiquer un message de détresse, étant audible sur de grandes distances sans que le sens original d’une phrase ne se perde dans une sorte de jeu de téléphone.
Piraha
Le linguiste Daniel Everett s’est initialement rendu auprès d’une petite tribu amazonienne nommée les Piraha dans le but de prêcher le christianisme, et il a publié ses expériences avec leur langue unique. Everett a fait une déclaration surprenante, affirmant que cette langue ne possède ni couleurs, ni nombres, ni véritable temps passé. Des recherches menées par le MIT ont corroboré l’absence de nombres dans la langue Piraha. Lorsqu’ils sont invités à compter des objets, les locuteurs utilisent un mot pour indiquer quatre et moins, et un autre pour cinq et plus. En termes de temporalité, la langue distingue le présent et le passé par rapport à l’expérience du locuteur, plutôt qu’avec des temps absolus. Ainsi, une action est considérée comme éloignée si elle a eu lieu en dehors du contrôle ou de l’existence immédiate du locuteur, et comme proche si elle s’est déroulée dans son existence immédiate.
La caractéristique la plus marquante du Piraha, selon Everett, est l’absence de clauses subordonnées. Si l’anglais n’avait pas de clauses subordonnées, il deviendrait une langue très difficile à manier, comme le résume l’Université de Pennsylvanie. Cependant, l’on considérait comme une règle universelle de la grammaire que toutes les langues possédaient une certaine forme de subordination. Pourtant, le Piraha semble en être dépourvu, bien que ce sujet soit encore débattu. Au lieu de cela, cette langue véhicule les pensées une à une. Ces caractéristiques, parmi d’autres, rendent la langue Piraha particulièrement difficile à appréhender, car elle semble violer de nombreuses règles de grammaire « universelles » et reste encore largement incomprise.