|
|
Thèmes
|
|
|
|
Avec l’analyse thématique, ou analyse des signifiés,
nous abordons la partie la plus subjective de toute analyse de textes. Il n’est pas facile de répondre à la question : qu’est-ce
qu’un thème ? La première façon de répondre, la plus profane, est de dire : un thème est ce dont on parle dans un
texte. Toute analyse de textes, telle que nous avons appris à les
exécuter à l’école sont des analyses thématiques. Quand on dit des phrases du
genre : « Le sujet de cette histoire est... », ce qui suit
est une série de thèmes. Autant dire que la thématique sera différente d’un
individu à l’autre, d’un analyste à l’autre. Et c’est la grande faiblesse de
ce type d’analyse, dans la mesure où chaque analyste aura tendance à trouver dans
n’importe quel texte, les thèmes qu’il a déjà en tête, ceux qu’il affectionne
particulièrement. La thématique, pour nous référer une fois de plus à la Sémantique
Générale, reflète notre façon de découper le réel.
Un exemple vécu par tous : à la sortie d’un cinéma,
si nous parlons du film que nous avons vu avec nos amis, nous constatons
qu’il semblerait que nous n’ayons pas été dans la même salle ! Il y a bien longtemps, nous nous sommes amusés à comparer
les analyses de plusieurs analystes, à partir de trois corpus de textes
n’ayant pratiquement aucun rapport entre eux, du genre : le marché des
stations-service, les médicaments antihypertenseurs et les pneus. Nous avons
trouvé plus de ressemblances entre les analyses du même analyste qu’entre les
trois analyses sur le même sujet d’étude ! A peine exagéré ! Bien sûr, il existe des méthodes d’analyse thématique, appelées
parfois analyses de contenu
(analyses de signifiés) permettant de réduire la subjectivité du travail
des analystes. Notre choix a été de confier ce travail à l’ordinateur
qui peut nous donner « objectivement » une analyse
thématique à partir d’un lexique et de textes donnés. Comment travaille-t-il ? On peut considérer qu’un thème
sera constitué de mots et d’expressions, ayant entre eux une certaine
ressemblance de comportements. Prenons un exemple : automobile, autobus, métro... pourront appartenir au même
thème que nous appellerons par exemple « moyens de transport »,
dans la mesure où ils pourront se retrouver l’un à la place de l’autre dans
les mêmes types de phrases : « Je
suis parti au bureau en .... ». Un thème sera ainsi constitué de mots et expressions commutatifs. Plus deux mots sont
commutatifs entre eux, plus ils seront, ce qu’on nomme en langage profane,
synonymes. On pourra ainsi dire que si deux mots qui peuvent se trouver l’un
comme l’autre dans 90 % de phrases, ils seront synonymes à 90 %. Nous notons au passage que le concept de synonymie n’existe pas en
linguistique ; on le remplace par le concept de pourcentage de synonymie. Le linguiste (qu’on qualifie souvent de distingué,
on ne sait pourquoi) est un individu particulièrement bête qui dit : si deux mots étaient vraiment synonymes,
il n’y en aurait qu’un. En raisonnant de cette façon, l’ordinateur peut nous
proposer une série de rapprochements de mots, un schéma thématique. Mais cela ne résout qu’une toute partie des difficultés
qui attendent l’analyste thématique. Si un thème est un regroupement de mots,
à quel seuil faut-il fixer le degré de synonymie de deux mots pour les
considérer comme faisant partie du même thème ? Il n’y a pas de réponses
théoriques, seulement des réponses pragmatiques et empiriques. Ce que nous
savons, c’est que plus ce seuil sera bas, plus les thèmes seront nombreux, et
moins ceux-ci seront représentés dans les textes ; au contraire un seuil trop
élevé aboutira à la création d’un trop petit nombre de thèmes, et donc à une
baisse de significativité des résultats, comme chaque fois que l’on
généralise trop les données. Une solution facile pour l’ordinateur consiste à regrouper
les mots en plusieurs niveaux, du plus précis au plus général, en créant
ainsi un arbre thématique. Ainsi nous aurons la possibilité d’étudier le même texte à
plusieurs niveaux de généralité selon nos besoins. Voici un exemple de regroupement en arbre :
On remarque tout de suite que même ainsi conçu, tout
classement thématique possédera une grande part d’arbitraire. En effet, rien
ne nous empêchait par exemple, de classer coq
et poule à côté de lapin et dinde, sous le thème « animaux
de basse-cour », au lieu de privilégier l’opposition oiseaux /
mammifères. Chacun d’entre nous possède sa propre thématique
personnelle, dont il a relativement peu conscience, et cela pour tous les
sujets possibles de conversations ; dans ces conditions, que l’entente règne
cela tient du miracle ! Le pessimisme n’est toutefois pas de rigueur dans le cas
de l’analyse de textes commerciaux, car la nature même du sujet étudié ainsi
que les clients d’ailleurs, nous dictent avec évidence une partie de la
« bonne » thématique. |