L’ANALYSE
DE CONTENU
par Marc Alain Descamps
I.
DEFINITION
L’analyse
de contenu est une technique de traitement de données préexistantes
par
recensement, classification et quantification des traits d’un corpus.
Il ne faut pas la confondre avec la recherche,
dans un corpus plus ou moins défini, d’exemples d’un système établi a priori
(comme dans les dictionnaires, les grammaires ou Barthes...). Il s’agit encore moins
de l’explication de texte ou du commentaire de texte classique des études secondaires
ou même primaires.
Cette
technique s’étudie à la fin car il lui faut bien une autre méthode de collecte
des données (observation, entretien, questionnaire...). Elle peut inspirer une recherche,
mais elle reste toujours une étape dans cette recherche.
L’analyse
de contenu demande un grand esprit scientifique pour accepter de tout compter
et de donner les vrais pourcentages.
Ceux qui
ont des convictions préalables ou des préjugés préfèrent faire beaucoup
d’entretiens ou de questionnaires pour paraître scientifique, puis après en
extraire tout ce qui est d’accord avec leur thèse, ou même donner comme
« preuve » de leur préjugé deux ou trois extraits ou citations, en
taisant tout ce qui est opposé.
2. TYPES
Il existe
trois types principaux d’analyse de contenu.
A.
Descriptive
Avec plus
ou moins de détail et de finesse on détermine les éléments et les catégories
d’un corpus.
Deux
techniques doivent toujours être combinées.
1) la
classification thématique ou liste des thèmes abordés dans le corpus.
2) le
décompte fréquentiel aboutissant à une analyse statistique.
Par exemple
dans ce corpus (26 entretiens, ou 12 numéros annuels de
4 mensuels,
ou les discours politiques de M.X...) il y a tant % d’allusions
On ne cherche pas à l’aveugle, et on n’entreprend
pas une analyse
Elles ne
doivent pas rester implicites.
Et en
suivant toujours l’orientation scientifique
On aboutit
alors à l’analyse descriptive SYSTEMATIQUE.
De plus tous
ces éléments ont des rapports entre eux, et l’on
Par exemple,
lorsque dans les textes s’expriment telles opinions religieuses ou politiques
on a le
plus souvent telles positions sur la famille, le sexe, la violence...
Pour cela il est utile d’étudier aussi les concomitances
thématiques
Par
exemple, quand il parle de sa voiture il parle toujours après de sa femme
et quand il
parle de son métier il aborde toujours aussitôt la question de l’argent,
mais ces
deux séries sont toujours éloignées.
En plus de
ce que dit le discours, on étudie comment il le dit.
On peut
dire que dans les deux types précédents l’analyse reste horizontale puisqu’on
ne sort pas du corpus, elle devient verticale lorsque des éléments hors du
corpus sont utilisés.
Par
exemple, on peut chercher à prouver que selon que les personnes sont divorcées
Par l’analyse
verticale on en vient à dévoiler les conditions de production du corpus.
On détermine les intentions explicites ou implicites des
auteurs des données.
On passe donc du contenu manifeste au contenu latent, que
l’on décrypte comme un rêve.
1.
La
détermination du corpus
On appelle corpus
l’ensemble des objets ou matériaux que l’on va étudier.
Ce peut être
des matériaux provoqués : réponses à des questions ouvertes, entretiens,
résultats sociométriques, dessins d’enfants...
Ils ont été
produits selon des hypothèses préalables.
Sinon ce
sont des matériaux naturels, lorsqu’ils sont déjà là : littérature, presse,
Mais si ces
matériaux ont été produits sans hypothèse,
Leur choix
et donc la constitution du corpus
Comme une population, le corpus peut être
trop vaste. On extrait
Il faut
déterminer avec précision son unité d’analyse, selon la taille et le nombre.
a) La
taille. Il faut égaliser la grandeur des éléments que l’on compare, ce peut
être le mot, la phrase, le paragraphe, le chapitre...
ou les publicités,
les personnages, les têtes, les lèvres,les dents...
L’inégalité
des segments naturels conduit à préférer des segments
Il faut utiliser
la taille d’unité la plus informative et ne pas
b) Le nombre.
On peut utiliser plusieurs tailles d’unités d’analyse,
3. Le
système catégoriel ou grille d’analyse
a)
Conditions.
1.
L’exclusion mutuelle. Chaque élément ne peutêtre affecté qu’à une seule case.
2.
homogénéité. Dans un système, toutes lescatégories ne doivent
3. Pertinence.
Les catégories doivent être adaptées à la fois au
4.
Productivité. L’ensemble des catégories doit apporter des résultats
5. Objectivité
et fidélité. Les catégories doivent être choisies avec assez de précision pour éliminer
les variations dues à la subjectivité des codeurs.
b) Sortes.
On peut utiliser des catégorisations formelles ou stylistiques quantitatives (%
des verbes, substantifs, noms propres, adjectifs...).
La plus
utilisée des catégories sémantiques est le thème, mais son
maniement
est plus délicat car les unités de sens sont inégales par le volume
(par exemple
on peut parler de sexe avec un mot, une phrase ou un paragraphe...).
c) Les
étapes de sa construction.
1. On
établit une première liste de grandes catégories à partir des hypothèses.
2. 2 ou 3
analyseurs, ayant opéré indépendamment, confrontent leurs
3. Ceci est
confronté avec le premier matériel que l’on cherche à classer.
4. Le
système est refondu pour être adapté à l’ensemble du matériel.
5. Il est
systématisé.
6. Il est
corrigé pour pouvoir être étendu à d’autres corpus.
4. Le formulaire d’analyse
C’est
l’instrument avec lequel on interroge lecorpus. Il va du
Les
chercheurs doivent utiliser une grille à au moins trois degrés.
Par
exemple, le thème étant ‘‘les relations familiales dans votre enfance’’
1) degré.
Les membres de la famille (père, mère, le sujet, un frère).
2) degré.
Les types de relation (d’autorité, d’information,
3) degré.
Les interrelations (père-mère, père-sujet, père-frère etc.).
Ce qui
donne le plan :
1er cas :
le père 1) autorité avec la mère
avec le sujet
avec le
frère
2) information avec la mère
avec le sujet
avec le
frère, etc...
Et ceci
reste horizontal descriptif, éventuellement s’y ajoute le structural et le
vertical.
Rien dans
le formulaire d’analyse ne doit être ambigu pour pouvoir
5. Les
tableaux de fréquence et la tabulation
Avec le
formulaire d’analyse on établit des tableaux de fréquence des catégories,
que les
codeurs vont avoir à remplir en analysant le corpus.
6. Les
codeurs
Trois ou
cinq codeurs vont faire indépendamment le même travail.
a) Leur
formation. On leur explique les buts et les règles de l’analyse,
b) La confrontation.
On confronte les fiches de notation des codeurs
c)
L’entraînement. Il se fait par exercices successifs pour augmenter
d) Le contrôle.
On opère à intervalles réguliers des contrôles
7.
L’analyse ou interprétation des résultats
C’est là où
apparaît la faiblesse de cette méthode qui n’est pas
ou on se
met à interpréter pour faire apparaître un sens.
Et c’est le
devoir de tout psychologue, qui doit savoir prendre ses responsabilités.
Il convient
alors d’apprécier la présentation de soi, de ses désirs,
Mais c’est
inéluctable, les faits ne veulent rien dire, il faut les faire parler.
C’est l’homme
qui prétend que la signification est dans les choses,
mais c’est
un construit et non un donné.
Les trois
cas les plus fréquents de pratiquer une analyse de contenu sont :
A. Les
réponses ouvertes
a) cas le
plus fréquent, étudié sur un exemple
Prenons le
cas le plus simple où l’on a demandé à 100 sujets de
On a donc,
par exemple, un corpus de 272 adjectifs car
L’enquêteur
commencera par grouper les synonymes, puis il joindra
Comme titre de catégorie, on choisira le
mot le plus employé et
Par exemple
la première catégorie sera :
1. BEAU 33
= beau 12, joli 8, magnifique 5, terrible 3, chouette
Beaucoup de
mots ont des sens et des emplois très différents.
L’enquêteur
doit donc se faire préciser lors de la passation le sens des mots
(terrible
signifie-t-il pour vous effrayant ou magnifique ?...).
Particulièrement
il faut faire préciser si le mot a un sens positif ou négatif : cher, riche,
somptueux, luxueux simple, pauvre, petit, gros, volontaire, sexuel, juste...?
Puis toutes
les catégories ayant été fournies et les 272 adjectifs
b) quelques
améliorations. On peut demander de décrire un
On le fera
en deux fois (ouvert et fermé):
1) Au début
du questionnaire on cherche un choix spontané, sans aucune influence.
Donc on demande de le décrire par
:
deux
qualités 1..........
2.........
deux
défauts 1..........
2.........
Si les
adjectifs vont dans tous les sens, il faut les regrouper dans une grille ; la
plus générale est :
positif négatif
activité productif... paresseux...
affectivité
séduisant... méchant...
intelligence astucieux... idiot...
2) A la fin
du questionnaire on force le choix pour vérifier, entre, par exemple, 10 mots.
Cette liste
provient de ses propres hypothèses, de ses lectures,
de l’analyse
de contenu de la question ouverte équivalente de la pré-enquête.
Ex. ‘‘Choisir
un adjectif (et un seul) en l’entourant dans chaque liste :
1. beau,
intelligent, grand, sérieux, riche
2. cruel,
autoritaire, têtu, sec, sournois’’.
c) Les
classifications préférentielles
On désire
faire classer par ordre de préférence un ensemble (par
de choix
seront rapportées dans un tableau de ce type :
Les
publicités : A B
C D E
F G H
I J
ordres de choix 1
22 7 10
13 5
6 12 14 14 0
2 12
10 8 5 13
12 7 19
7 3
3 4
14 7 9
8 3 14
11 6 7
4 3
8 12 8 11 4
5 13 9 5
5 5
4 16 10
14 3
10 7 10 8
6 2
6 11 4
13 5 8
6 12
6
7 6 12 5
12 14 13
11 8 14 12
8
11 4 8
20 7 18 13 2 10 18
9 10 5 9 18 8 19 10
3 3
21
10
18 3 5
0 4 17 10 1 2 20
Puis on
multiplie les ordres par les fréquences (ex. pour A (1x22)
A B
C D E
F G H
I J
507 348
471 562 513
656 557 317
429 740
On calcule
la moyenne de ces chiffres =510 et
l’on fait les
Ordre
1 2 3 4 5
6 7 8 9 10
selon les
10 choix H+193 B+162
I+81 C+39 A+3
E-3
Seule la
photo J est dans les deux cas classée dernière, la photo
d) le cas
des différentiels sémantiques
Le
différentiateur sémantique d’OSGOOD est le modèle du genre.
Il permet
de déterminer le sens qu’une population attribue à un objet,
qui peut
être un mot, une notion (par ex : la mode, l’écologie, l’informatique),
la
photographie d’une personne, une image publicitaire, une automobile,etc.
On utilise
des échelles bipolaires de valeur en 7 points du type : (par exemple)
BEAU
Très - Assez -
Peu - 0 - Peu -
Assez - Très LAID
|________|________|______|_______|_______|_________|_______!
Les sujets
cochent une case, on fait la moyenne des notes et on dispose
L’analyse
factorielle des diverses échelles utilisées a fourni
Osgood
n’avait travaillé que sur des Californiens de niveau moyen.
De
nombreuses autres études ont retrouvé ces mêmes facteurs = 1) pour
Les échelles
d’Osgood étaient en anglais avec leurs
Le corpus
(formé soit de l’ensemble des entretiens recopiés, soit
Le second
volume présentant l’analyse de contenu, devra comporter
On pose au
départ des hypothèses et à la fin on conclut sur :
1) leur vérification
ou non selon un bilan chiffré
2) les
significations cachées que l’analyse a permis de faire apparaître.
Il y a donc
une double conclusion :
1) expérimentale et statistique
1) Les
dessins
Les catégories
d’analyse vont dépendre de l’objet étudié et des consignes de passation. Nous prenons
l’exemple d’analyse de contenu de centaines de dessins d’enfants que des
chirurgiens-dentistes ont fait exécuter dans leur salle d’attente.
On peut étudier
1.
L’emplacement du dessin. Occupe-t-il tout l’espace possible,
Comme base
de départ on peut considérer que la page
se répartit en 9 zones.
PASSE PRESENT
AVENIR
IDEALISME idéalise le
passé idéalise le présent idéalise l’avenir
REALISME la mère
moi
le père
MATERIALISME Fixation ou régression à la mère/ dépression
/l’évasion
b) dynamogènes (bleu, vert, jaune, rose)
c)
agressives (rouge, orange).
tour du
dentiste...), les armes ou outils...
L’étude se
fait au triple niveau
1)
quantitatif avec le pourcentage de tout ce qui peut être compté
2) vertical.
Liaison des dessins avec les catégories de patients
3)
qualitatif. Une interprétation est à faire selon les catégories
Mais quelle
que soit la finesse de l’analyse de contenu les dessins
Les méthodes
d’analyse d’images sont aussi nombreuses que complexes et décevantes. Nous ne
proposons que quelques axes simples :
1. Le code
dénotatif. On procède par dénombrement de tout ce qui
On peut
aussi étudier les distances, positions, recouvrements, couleurs,
2. Le code
photographique. L’étude des publicités peut aussi utiliser
cadrage
(plan d’ensemble ou paysage, de demi-ensemble ou personnage et
angle de
prise de vue (horizontal, plongée, contre-plongée, vertical de dessus
l’éclairage
(naturel avec ou sans éléments d’appoint comme des réflecteurs
l’objectif
(normal, télé, grand angle, circulaire ou fish-eye...),
les filtres
(ultra-violet, colorés, caches, flous artistiques ou de bougé...),
la
reproduction (grain, papier, retouches, surimpression, dye-transfer...),
la
composition (horizontale, diagonale, circulaire, avec ligne de fuite...),
le
chromatisme (en noir et blanc, monochromatique, à dominante de
couleur,contrastée, estompée...), etc.
3. Le code
typographique. Les lettres du titre et des textes d’une image publicitaire
doivent être étudiés comme des dessins, indépendamment de leur sens.
La première
distinction est entre la visibilité et la lisibilité :
les
caractères de typovision sont pour les affiches qui doivent accrocher le
regard,
ceux de
typolecture sont pour les placards de revues vus plus près.
Il reste
après à analyser les caractères
selon les
corps (plus d’une quarantaine dans un journal), la graisse
4. Le code sémiologique. Démontrer une image publicitaire,
c’est
Par
exemple, le message de dénotation qui montre massivement l’objet sans
symbolisme est une publicité de lancement ou de notoriété.
Au
contraire le message de connotation est non figuratif,
Ainsi le même
objet devant un décor de campagne suggère la France traditionnelle,
devant un
monument futuriste le Progrès, devant un groupe familial le Foyer, etc.
Ou bien le
personnage principal est de face pour imposer
Reste à
savoir pourquoi les yeux sont maquillés ou non le regard baissé ou levé, etc.
On pourra
alors utiliser un code rhétorique, lexicologique, etc.