Thèmes

 

Avec l’analyse thématique, ou analyse des signifiés, nous abordons la partie la plus subjective de toute analyse de textes.

 

Il n’est pas facile de répondre à la question : qu’est-ce qu’un thème ? La première façon de répondre, la plus profane, est de dire : un thème est ce dont on parle dans un texte. Toute analyse de textes, telle que nous avons appris à les exécuter à l’école sont des analyses thématiques. Quand on dit des phrases du genre : « Le sujet de cette histoire est... », ce qui suit est une série de thèmes. Autant dire que la thématique sera différente d’un individu à l’autre, d’un analyste à l’autre. Et c’est la grande faiblesse de ce type d’analyse, dans la mesure où chaque analyste aura tendance à trouver dans n’importe quel texte, les thèmes qu’il a déjà en tête, ceux qu’il affectionne particulièrement.

 

La thématique, pour nous référer une fois de plus à la Sémantique Générale, reflète notre façon de découper le réel.

Un exemple vécu par tous : à la sortie d’un cinéma, si nous parlons du film que nous avons vu avec nos amis, nous constatons qu’il semblerait que nous n’ayons pas été dans la même salle !

 

Il y a bien longtemps, nous nous sommes amusés à comparer les analyses de plusieurs analystes, à partir de trois corpus de textes n’ayant pratiquement aucun rapport entre eux, du genre : le marché des stations-service, les médicaments antihypertenseurs et les pneus. Nous avons trouvé plus de ressemblances entre les analyses du même analyste qu’entre les trois analyses sur le même sujet d’étude !

A peine exagéré !

 

Bien sûr, il existe des méthodes d’analyse thématique, appelées parfois analyses de contenu (analyses de signifiés) permettant de réduire la subjectivité du travail des analystes. Notre choix a été de confier ce travail à l’ordinateur qui peut nous donner « objectivement » une analyse thématique à partir d’un lexique et de textes donnés.

 

Comment travaille-t-il ? On peut considérer qu’un thème sera constitué de mots et d’expressions, ayant entre eux une certaine ressemblance de comportements. Prenons un exemple : automobile, autobus, métro... pourront appartenir au même thème que nous appellerons par exemple « moyens de transport », dans la mesure où ils pourront se retrouver l’un à la place de l’autre dans les mêmes types de phrases : « Je suis parti au bureau en .... ».

Un thème sera ainsi constitué de mots et expressions commutatifs. Plus deux mots sont commutatifs entre eux, plus ils seront, ce qu’on nomme en langage profane, synonymes. On pourra ainsi dire que si deux mots qui peuvent se trouver l’un comme l’autre dans 90 % de phrases, ils seront synonymes à 90 %.

Nous notons au passage que le concept de synonymie n’existe pas en linguistique ; on le remplace par le concept de pourcentage de synonymie.

Le linguiste (qu’on qualifie souvent de distingué, on ne sait pourquoi) est un individu particulièrement bête qui dit : si deux mots étaient vraiment synonymes, il n’y en aurait qu’un.

 

En raisonnant de cette façon, l’ordinateur peut nous proposer une série de rapprochements de mots, un schéma thématique.

Mais cela ne résout qu’une toute partie des difficultés qui attendent l’analyste thématique. Si un thème est un regroupement de mots, à quel seuil faut-il fixer le degré de synonymie de deux mots pour les considérer comme faisant partie du même thème ? Il n’y a pas de réponses théoriques, seulement des réponses pragmatiques et empiriques. Ce que nous savons, c’est que plus ce seuil sera bas, plus les thèmes seront nombreux, et moins ceux-ci seront représentés dans les textes ; au contraire un seuil trop élevé aboutira à la création d’un trop petit nombre de thèmes, et donc à une baisse de significativité des résultats, comme chaque fois que l’on généralise trop les données.

 

Une solution facile pour l’ordinateur consiste à regrouper les mots en plusieurs niveaux, du plus précis au plus général, en créant ainsi un arbre thématique.

 

Ainsi nous aurons la possibilité d’étudier le même texte à plusieurs niveaux de généralité selon nos besoins.

 

Voici un exemple de regroupement en arbre :

 

On remarque tout de suite que même ainsi conçu, tout classement thématique possédera une grande part d’arbitraire. En effet, rien ne nous empêchait par exemple, de classer coq et poule à côté de lapin et dinde, sous le thème « animaux de basse-cour », au lieu de privilégier l’opposition oiseaux / mammifères.

Chacun d’entre nous possède sa propre thématique personnelle, dont il a relativement peu conscience, et cela pour tous les sujets possibles de conversations ; dans ces conditions, que l’entente règne cela tient du miracle !

 

Le pessimisme n’est toutefois pas de rigueur dans le cas de l’analyse de textes commerciaux, car la nature même du sujet étudié ainsi que les clients d’ailleurs, nous dictent avec évidence une partie de la « bonne » thématique.