L’ANALYSE DE CONTENU

par Marc Alain Descamps

 

I. DEFINITION

L’analyse de contenu est une technique de traitement de données préexistantes
par recensement, classification et quantification des traits d’un corpus.

    Il ne faut pas la confondre avec la recherche, dans un corpus plus ou moins défini, d’exemples d’un système établi a priori (comme dans les dictionnaires, les grammaires ou Barthes...). Il s’agit encore moins de l’explication de texte ou du commentaire de texte classique des études secondaires ou même primaires.
    Cette technique s’étudie à la fin car il lui faut bien une autre méthode de collecte des données (observation, entretien, questionnaire...). Elle peut inspirer une recherche, mais elle reste toujours une étape dans cette recherche.

L’analyse de contenu demande un grand esprit scientifique pour accepter de tout compter et de donner les vrais pourcentages.

Ceux qui ont des convictions préalables ou des préjugés préfèrent faire beaucoup d’entretiens ou de questionnaires pour paraître scientifique, puis après en extraire tout ce qui est d’accord avec leur thèse, ou même donner comme « preuve » de leur préjugé deux ou trois extraits ou citations, en taisant tout ce qui est opposé.

2. TYPES

Il existe trois types principaux d’analyse de contenu.

A. Descriptive

Avec plus ou moins de détail et de finesse on détermine les éléments et les catégories d’un corpus.
Deux techniques doivent toujours être combinées.

1) la classification thématique ou liste des thèmes abordés dans le corpus.
2) le décompte fréquentiel aboutissant à une analyse statistique.

Par exemple dans ce corpus (26 entretiens, ou 12 numéros annuels de
4 mensuels, ou les discours politiques de M.X...) il y a tant % d’allusions à l’argent, au sexe, à la violence, à la guerre, au sport, aux femmes, à la famille etc.

    On ne cherche pas à l’aveugle, et on n’entreprend pas une analyse de contenu sans une ou des idées derrière la tête.
Elles ne doivent pas rester implicites.
Et en suivant toujours l’orientation scientifique on doit les faire apparaître et aboutir à des hypothèses préalables que l’on cherchera à vérifier par l’analyse de contenu.

On aboutit alors à l’analyse descriptive SYSTEMATIQUE.

 B. Structurale

De plus tous ces éléments ont des rapports entre eux, et l’on cherche alors faire apparaître ces liens en croisant les éléments entre eux.

Par exemple, lorsque dans les textes s’expriment telles opinions religieuses ou politiques
on a le plus souvent telles positions sur la famille, le sexe, la violence...

    Pour cela il est utile d’étudier aussi les concomitances thématiques (unies avec les décomptes fréquentiels). On repèrera les thèmes toujours liés (dits à la suite ou proches) et les thèmes toujours séparés (loin dans le discours ou loin les uns des autres).

Par exemple, quand il parle de sa voiture il parle toujours après de sa femme
et quand il parle de son métier il aborde toujours aussitôt la question de l’argent,
mais ces deux séries sont toujours éloignées.

En plus de ce que dit le discours, on étudie comment il le dit.

 C. Verticale

On peut dire que dans les deux types précédents l’analyse reste horizontale puisqu’on ne sort pas du corpus, elle devient verticale lorsque des éléments hors du corpus sont utilisés.

Par exemple, on peut chercher à prouver que selon que les personnes sont divorcées ou non, on a des attitudes religieuses opposées, donc des opinions sur le sexe, la violence...

   Par l’analyse verticale on en vient à dévoiler les conditions de production du corpus.
On détermine les intentions explicites ou implicites des auteurs des données.
On passe donc du contenu manifeste au contenu latent, que l’on décrypte comme un rêve.

 3. LES ETAPES

                                         1. La détermination du corpus

On appelle corpus l’ensemble des objets ou matériaux que l’on va étudier.
Ce peut être des matériaux provoqués : réponses à des questions ouvertes, entretiens, résultats sociométriques, dessins d’enfants...

Ils ont été produits selon des hypothèses préalables.
Sinon ce sont des matériaux naturels, lorsqu’ils sont déjà là : littérature, presse, publicité, bandes dessinées, films...

Mais si ces matériaux ont été produits sans hypothèse,
Leur choix et donc la constitution du corpus relève d’hypothèses qui ne doivent pas rester implicites.

    Comme une population, le corpus peut être trop vaste. On extrait alors du corpus-univers, un corpus-population selon les différentes méthodes d’échantillonnage par strates ou quotas ou prélèvements aléatoires, de façon à disposer d’un modèle réduit proportionnel.

                                     2. L’unité d’analyse ou segment

Il faut déterminer avec précision son unité d’analyse, selon la taille et le nombre.

a) La taille. Il faut égaliser la grandeur des éléments que l’on compare, ce peut être le mot, la phrase, le paragraphe, le chapitre...
ou les publicités, les personnages, les têtes, les lèvres,les dents...

L’inégalité des segments naturels conduit à préférer des segments construits pour plus de précision : on compte les lignes et non les phrases, les centimètres carrés d’une photo, les secondes de silence dans un enregistrement d’entretien au magnétophone.

Il faut utiliser la taille d’unité la plus informative et ne pas toujours en rester au thème (ou évocation d’un sujet).

b) Le nombre. On peut utiliser plusieurs tailles d’unités d’analyse, pour plus de sûreté et de précision. La petitesse de l’unité d’analyse a l’effet de grossissement du microscope.

                              3. Le système catégoriel ou grille d’analyse

a) Conditions.

1. L’exclusion mutuelle. Chaque élément ne peutêtre affecté qu’à une seule case.
2. homogénéité. Dans un système, toutes lescatégories ne doivent relever que d’un seul principe.
3. Pertinence. Les catégories doivent être adaptées à la fois au matériel choisi et au cadre théorique retenu.
4. Productivité. L’ensemble des catégories doit apporter des résultats riches en données fiables, indices d’inférences, en hypothèses nouvelles.
5. Objectivité et fidélité. Les catégories doivent être choisies avec assez de précision pour éliminer les variations dues à la subjectivité des codeurs.

b) Sortes. On peut utiliser des catégorisations formelles ou stylistiques quantitatives (% des verbes, substantifs, noms propres, adjectifs...).
La plus utilisée des catégories sémantiques est le thème, mais son
maniement est plus délicat car les unités de sens sont inégales par le volume
(par exemple on peut parler de sexe avec un mot, une phrase ou un paragraphe...).

c) Les étapes de sa construction.

1. On établit une première liste de grandes catégories à partir des hypothèses.
2. 2 ou 3 analyseurs, ayant opéré indépendamment, confrontent leurs systèmes et cherchent à se mettre d’accord.
3. Ceci est confronté avec le premier matériel que l’on cherche à classer.
4. Le système est refondu pour être adapté à l’ensemble du matériel.
5. Il est systématisé.
6. Il est corrigé pour pouvoir être étendu à d’autres corpus.

                                     4. Le formulaire d’analyse

C’est l’instrument avec lequel on interroge lecorpus. Il va du répertoriage de quelques thèmes privilégiés dans l’analyse thématique classique, à l’établissement d’un véritable questionnaire avec ses groupes de questions, ses échelles, ses indices numériques...

Les chercheurs doivent utiliser une grille à au moins trois degrés.
Par exemple, le thème étant ‘‘les relations familiales dans votre enfance’’
1) degré. Les membres de la famille (père, mère, le sujet, un frère).
2) degré. Les types de relation (d’autorité, d’information, agressives, d’aide, affectives, corporelles).
3) degré. Les interrelations (père-mère, père-sujet, père-frère etc.).

Ce qui donne le plan :
1er cas : le père  1) autorité         avec la mère
                                                       avec le  sujet
                                                       avec le frère

                            2) information    avec la mère
                                                       avec le sujet
                                                       avec le frère,            etc...

Et ceci reste horizontal descriptif, éventuellement s’y ajoute le structural et le vertical.
Rien dans le formulaire d’analyse ne doit être ambigu pour pouvoir être refait de la même manière par des personnes différentes.

                                     5. Les tableaux de fréquence et la tabulation

Avec le formulaire d’analyse on établit des tableaux de fréquence des catégories,
que les codeurs vont avoir à remplir en analysant le corpus.

                                                           6. Les codeurs

Trois ou cinq codeurs vont faire indépendamment le même travail.
a) Leur formation. On leur explique les buts et les règles de l’analyse, les unités d’analyse, le système des catégories, les règles de notation.
b) La confrontation. On confronte les fiches de notation des codeurs et l’on discute des différences.
c) L’entraînement. Il se fait par exercices successifs pour augmenter la fidélité, jusqu’à ce qu’il n’y ait plus d’ambiguïté et que les codeurs aient bien compris les normes choisies, les unités claires, les catégories bien définies.
 d) Le contrôle. On opère à intervalles réguliers des contrôles pour voir si un ou plusieurs codeurs ne se mettent pas à négliger un thème ou s’il n’y a pas des éléments qui leur échappent.

                                       7. L’analyse ou interprétation des résultats

C’est là où apparaît la faiblesse de cette méthode qui n’est pas toujours démonstrative et qui prête à discussion. Ou dans la conclusion, on en reste au quantitatif et c’est sans finesse et souvent de peu d’intérêt,
ou on se met à interpréter pour faire apparaître un sens.
Et c’est le devoir de tout psychologue, qui doit savoir prendre ses responsabilités.
Il convient alors d’apprécier la présentation de soi, de ses désirs, de ses motivation, et de ses freins, les attitudes, demandes, attentes, projets, intentions etc. On a alors réintroduit la subjectivité avec la signification.
Mais c’est inéluctable, les faits ne veulent rien dire, il faut les faire parler.
C’est l’homme qui prétend que la signification est dans les choses,
mais c’est un construit et non un donné.

 4. LES OCCASIONS

Les trois cas les plus fréquents de pratiquer une analyse de contenu sont :

A. Les réponses ouvertes
a) cas le plus fréquent, étudié sur un exemple
Prenons le cas le plus simple où l’on a demandé à 100 sujets de répondre à une question ou de réagir à un dessin, en donnant trois adjectifs.
On a donc, par exemple, un corpus de 272 adjectifs car 80 sujets ont bien donné 3 adjectifs, mais 12 n’en ont donné que 2 et 8 qu’un seul.

L’enquêteur commencera par grouper les synonymes, puis il joindra à chaque groupe les termes apparentés. Il cherchera à répartir les 272 adjectifs dans les catégories obtenues en évitant si possible la catégorie ‘‘divers’’. Aucune règle ne peut être donnée pour cela, car cela dépend de l’intelligence et de la connaissance de la logique à travers les catégories de sens ; les étrangers (ou français) qui ne parlent pas parfaitement le français ne peuvent pas faire ce travail.

    Comme titre de catégorie, on choisira le mot le plus employé et l’on fournira la liste de tous les mots synonymes affectés de leur indice de fréquence.
Par exemple la première catégorie sera :
1. BEAU 33 = beau 12, joli 8, magnifique 5, terrible 3, chouette2, splendide 1, formi 1, superbe 1.

Beaucoup de mots ont des sens et des emplois très différents.
L’enquêteur doit donc se faire préciser lors de la passation le sens des mots
(terrible signifie-t-il pour vous effrayant ou magnifique ?...).
Particulièrement il faut faire préciser si le mot a un sens positif ou négatif : cher, riche, somptueux, luxueux simple, pauvre, petit, gros, volontaire, sexuel, juste...?
Puis toutes les catégories ayant été fournies et les 272 adjectifs répartis, l’étudiant devra prendre position et conclure sur le sens, et sur ce que ces réponses prouvent pour lui.

b) quelques améliorations. On peut demander de décrire un objet (une voiture Renault), une notion (l’informatique) ou un personnage (le Président de la République) par 4 adjectifs.

On le fera en deux fois (ouvert et fermé):
1) Au début du questionnaire on cherche un choix spontané, sans aucune influence.
                Donc on demande de le décrire par :
      deux  qualités 1..........               2.........
      deux  défauts 1..........                2.........

Si les adjectifs vont dans tous les sens, il faut les regrouper dans une grille ; la plus générale est :

                                   positif         négatif           
               activité         productif...   paresseux...
              affectivité     séduisant...  méchant...
              intelligence   astucieux...   idiot...

2) A la fin du questionnaire on force le choix pour vérifier, entre, par exemple, 10 mots.
Cette liste provient de ses propres hypothèses, de ses lectures,
de l’analyse de contenu de la question ouverte équivalente de la pré-enquête.

Ex. ‘‘Choisir un adjectif (et un seul) en l’entourant dans chaque liste :
1. beau, intelligent, grand, sérieux, riche
2. cruel, autoritaire, têtu, sec, sournois’’.

c) Les classifications préférentielles
On désire faire classer par ordre de préférence un ensemble (par exemple 10 publicités) par une population de 100 sujets. On peut demander à chacun d’indiquer la publicité qu’il préfère, mais il vaut mieux leur demander de classer l’ensemble par ordre de préférence. Les fréquences
de choix seront rapportées dans un tableau de ce type :

Les publicités :            A     B      C     D      E    F    G     H      I      J
ordres  de choix 1       22    7     10    13     5    6    12   14    14     0
                            2       12   10      8     5     13   12   7     19    7      3
                            3       4    14      7      9      8     3    14    11    6      7
                            4        3      8     12     8    11    4     5    13     9      5
                            5        5      4     16   10    14    3   10      7    10     8
                            6        2      6     11    4     13     5     8      6    12     6
                            7        6     12     5     12   14   13   11     8    14    12
                            8       11     4      8     20     7     18   13    2    10   18
                            9      10     5      9     18     8      19   10    3      3    21
                          10       18     3      5     0       4      17   10    1      2    20

Puis on multiplie les ordres par les fréquences (ex. pour A (1x22) + (2x12) +...) et on en fait la somme. Chaque photo est affectée d’un chiffre inversement proportionnel à son succès soit :

          A      B        C       D      E        F        G       H        I        J
         507   348   471   562   513   656    557   317   429   740

On calcule la moyenne de ces chiffres    =510 et l’on fait les différences à la moyenne, puis on inverse la valeur algébrique, ce qui donne l’ordre :
 Ordre                        1           2              3          4        5        6            
7        8       9           10 
selon les 10 choix   H+193  B+162   I+81   C+39    A+3    E-3    
G-47  D-52  F-148  J-230

   Et selon le 1er choix        A22      H14      T14     D13     G12   C10    B7      F6      E5      J.O

Seule la photo J est dans les deux cas classée dernière, la photo A que l’on aurait pu croire la préférée, car la plus souvent mise en première place, est en fait cinquième. En l’étudiant on s’aperçoit qu’elle a une courbe en U : elle ne laisse pas indifférent et est aussi détestée qu’aimée. Il convient maintenant d’étudier l’effet des variables sur ce choix pour trouver si ceux qui la préfèrent sont les hommes, les jeunes ou les agressifs etc.

d) le cas des différentiels sémantiques

Le différentiateur sémantique d’OSGOOD est le modèle du genre.
Il permet de déterminer le sens qu’une population attribue à un objet,
qui peut être un mot, une notion (par ex : la mode, l’écologie, l’informatique),
la photographie d’une personne, une image publicitaire, une automobile,etc.

On utilise des échelles bipolaires de valeur en 7 points du type : (par exemple)

      BEAU     Très -     Assez -      Peu -      0           - Peu      -   Assez -      Très        LAID

                   |________|________|______|_______|_______|_________|_______!

Les sujets cochent une case, on fait la moyenne des notes et on dispose d’un profil de polarité.

L’analyse factorielle des diverses échelles utilisées a fourni trois facteurs : évaluatif, de puissance, d’activité.

Osgood n’avait travaillé que sur des Californiens de niveau moyen.
De nombreuses autres études ont retrouvé ces mêmes facteurs = 1) pour les différentes couches de population 2) dans plus de 20 civilisations différentes 3) pour des mots ou des images.
Les échelles d’Osgood étaient en anglais avec leurs corrélations et la vraie traduction en français reste à trouver.

 B. Les entretiens ou le corpus de textes

Le corpus (formé soit de l’ensemble des entretiens recopiés, soit de l’ensemble des textes retenus) doit être fourni en un volume séparé.
Le second volume présentant l’analyse de contenu, devra comporter la grille avec les catégories et les unités correspondantes, plus les dénombrements et pourcentages pour chaque catégorie.

On pose au départ des hypothèses et à la fin on conclut sur :
1) leur vérification ou non selon un bilan chiffré
2) les significations cachées que l’analyse a permis de faire apparaître.

Il y a donc une double conclusion :
                       1) expérimentale et statistique   2) clinique et psychanalytique.

 C. L’analyse iconique

1) Les dessins

Les catégories d’analyse vont dépendre de l’objet étudié et des consignes de passation. Nous prenons l’exemple d’analyse de contenu de centaines de dessins d’enfants que des chirurgiens-dentistes ont fait exécuter dans leur salle d’attente.
On peut étudier
1. L’emplacement du dessin. Occupe-t-il tout l’espace possible, ou un quart seulement dans un coin ?

Comme base de départ on peut considérer que la  page se répartit en 9 zones.

                             PASSE                         PRESENT                       AVENIR

IDEALISME     idéalise le  passé          idéalise le présent           idéalise l’avenir

REALISME         la mère                          moi                                   le père

MATERIALISME  Fixation ou régression à la mère/   dépression    /l’évasion

 2. Le code des couleurs   a) dépressives (marron, noir, violet, blanc)
                                             b) dynamogènes (bleu, vert, jaune, rose)
                                             c) agressives (rouge,  orange).

 3. Les personnages. Leur nombre, leur identité (ne pas oublier de le demander à l’enfant et de l’inscrire derrière la feuille), leur grandeur relative (la taille double ou triple indique l’importance psychologique), les relations entre lui et les autres, les mutilations corporelles (tête, jambes, bras, mains...) les dents visibles...

 4. Le cadre : la maison (et la signification de ses éléments : porte, fenêtres, cheminée, fumée qui sort...), la nature (les animaux, les fleurs, arbres, herbe, le soleil...), les machines (fauteuil et
tour du dentiste...), les armes ou outils...

L’étude se fait au triple niveau
1) quantitatif avec le pourcentage de tout ce qui peut être compté
2) vertical. Liaison des dessins avec les catégories de patients(ceux qui viennent pour la première fois, ceux qui ont peu souffert ou beaucoup souffert la fois précédente...)
3) qualitatif. Une interprétation est à faire selon les catégories psycho-pathologiques et psychanalytiques.

Mais quelle que soit la finesse de l’analyse de contenu les dessins d’enfants ne sont pas un très bon indicateur de leur anxiété, agressivité ou vécu des souffrances...

 2) Les photos ou publicités

Les méthodes d’analyse d’images sont aussi nombreuses que complexes et décevantes. Nous ne proposons que quelques axes simples :

1. Le code dénotatif. On procède par dénombrement de tout ce qui peut être compté dans une image ou par étude proportionnelle en comptant le nombre de centimètre carré occupé par chaque éléments de l’image.

On peut aussi étudier les distances, positions, recouvrements, couleurs, relations... des personnages (ou objets principaux), les habits, accessoires, décors, situations...

2. Le code photographique. L’étude des publicités peut aussi utilisertout ce qui a été mis au point pour l’analyse des photos : catégorie (reportage,documentaire, sur le vif, posée, expressionniste, impressionniste...),
cadrage (plan d’ensemble ou paysage, de demi-ensemble ou personnage et son cadre, moyen ou en pied, américain à mi-cuisse, rapproché ou en buste, gros plan ou portrait, très gros plan ou détail),
angle de prise de vue (horizontal, plongée, contre-plongée, vertical de dessus ou de dessous, plus la caméra subjective ou le champ contre-champ),
l’éclairage (naturel avec ou sans éléments d’appoint comme des réflecteurs ou open-flash, de studio où la ou les lumières combinent les angles de prise de vue),
l’objectif (normal, télé, grand angle, circulaire ou fish-eye...),
les filtres (ultra-violet, colorés, caches, flous artistiques ou de bougé...),
la reproduction (grain, papier, retouches, surimpression, dye-transfer...),
la composition (horizontale, diagonale, circulaire, avec ligne de fuite...),
le chromatisme (en noir et blanc, monochromatique, à dominante de couleur,contrastée, estompée...), etc.

3. Le code typographique. Les lettres du titre et des textes d’une image publicitaire doivent être étudiés comme des dessins, indépendamment de leur sens.
La première distinction est entre la visibilité et la lisibilité :
les caractères de typovision sont pour les affiches qui doivent accrocher le regard,
ceux de typolecture sont pour les placards de revues vus plus près.

Il reste après à analyser les caractères
selon les corps (plus d’une quarantaine dans un journal), la graisse (ou épaisseur), la pente, la chasse, les familles (Gothic, Caslon, Franklin...) et leurs sens.

4. Le code sémiologique. Démontrer une image publicitaire, c’est montrer comment elle a été construite : chaque éléments a été pensé, choisi avec soin et essayé de façon à réaliser un but qu’il s’agit de découvrir.  C’est l’intention, l’axe, la stratégie, la cible... de la publicité.

Par exemple, le message de dénotation qui montre massivement l’objet sans symbolisme est une publicité de lancement ou de notoriété.
Au contraire le message de connotation est non figuratif, immatériel et symbolique ; il passe de l’objet au signe.
Ainsi le même objet devant un décor de campagne suggère la France traditionnelle,
devant un monument futuriste le Progrès, devant un groupe familial le Foyer, etc.

Ou bien le personnage principal est de face pour imposer le message de manière directe et impérieux, de trois-quarts pour engager le dialogue et conseiller de façon nuancée, de profil pour mettre le lecteur dans l’anecdote où le récit remplace le discours.
Reste à savoir pourquoi les yeux sont maquillés ou non le regard baissé ou levé, etc.

On pourra alors utiliser un code rhétorique, lexicologique,  etc.