Noms des entreprises en Bretagne administrative – Partie 1

Dans un précédent billet, nous nous étions intéressé aux entreprises en Bretagne administrative, sous l’angle de l’activité, de la catégorie ou encore de l’effectif.

Nous allons nous cette fois-ci nous focaliser sur le nom des entreprises.

Données

Les informations sur les entreprises et leurs établissements proviennent de la base Sirenedisponible en Open Data sur le site data.gouv.fr.

Les entreprises répertoriées dans ce jeu de données peuvent-être classées en 2 catégories :

  1. Les entreprises.
  2. Les entrepreneurs individuels.

Nous ne traiterons ici que la première catégorie, celle des entreprises. La dénomination d’une entreprise individuelle pouvant essentiellement être constituée par le nom de la personne morale la possédant, cette étude porterait alors sur des patronymes plutôt que sur des noms communs.

Précisons que la base Sirene recense le nom d’exploitation de la société ainsi que le nom de l’enseigne, qui peuvent parfois être différents. C’est le nom d’exploitation que nous utiliserons ici.

Analyse exploratoire

Pour mémoire, le nombre d’établissements référencés en Bretagne administrative est de 468 108.

Etablissements par type

Les entreprises non-individuelles, que nous étudierons ici, représentent 61.4% de la totalité.

Nombre de caractères par nom d'établissement

Le nombre moyen de caractères du nom d’un établissement est de 21 (nombre médian de 18, représenté par la ligne en pointillés).

Le nombre d’établissements diminue régulièrement à partir de 14 caractères, avec une distribution à coefficient de dissymétrie positif (positive skew distribution). Une exception apparaît pour les noms composés de 38 caractères (6 128 occurrences). Aucun élément présent dans le jeu de données ne permet d’expliquer ce phénomène, probablement dû au simple fait du hasard.

Mise à jour du 01/04/2017 :

Le pic de dénominations de 38 caractères a en fait une explication, qui nous a été donnée par un interlocuteur de l’INSEE (que nous remercions). Le champ de dénomination de la base Sirene était limité à 38 caractères jusque dans les années 1990 (il est ensuite passé à 120 caractères). Les gestionnaires faisaient donc en sorte de consigner cette dénomination sur 38 caractères, en abrégeant certains mots. On observe ainsi un arrêt de la décroissance du nombre de dénominations entre 35 et 37 caractères.

Passons au nombre de mots par nom d’établissement.

Nombre de mots par nom d'établissement

Visualisons la même information sous la forme d’une boite à moustaches.

Nombre de mots par nom d'établissement

50% des noms sont composés de 2 à 5 mots.

Regardons quelle est la distribution du nombre de mots en fonction de l’activité.

Nombre de mots par activité

Les établissements d’activité EOPQ et U (respectivement Production et distribution d’eau ; assainissement, gestion des déchets et dépollution / Administration publique / Enseignement / Santé humaine et action sociale / Activités extra-territoriales) ont des noms avec un plus grand nombre de mots que pour les autres activités. Ceci s’explique notamment par le fait que le nom, en plus de la désignation de l’activité, peut contenir le lieu d’action (exemples : “Préfecture du département du Finistère”, “Chambre commerce et industrie de Morlaix”, “Dir interdep routes ouest cei de Brest”, etc.).

Le tableau suivant liste tous les codes d’activité.

Code Libellé
A Agriculture, sylviculture et pêche
B Industries extractives
C Industrie manufacturière
D Production et distribution d’électricité, de gaz, de vapeur et d’air conditionné
E Production et distribution d’eau ; assainissement, gestion des déchets et dépollution
F Construction
G Commerce ; réparation d’automobiles et de motocycles
H Transports et entreposage
I Hébergement et restauration
J Information et communication
K Activités financières et d’assurance
L Activités immobilières
M Activités spécialisées, scientifiques et techniques
N Activités de services administratifs et de soutien
O Administration publique
P Enseignement
Q Santé humaine et action sociale
R Arts, spectacles et activités récréatives
S Autres activités de services
T Activités des ménages en tant qu’employeurs ; activités indifférenciées des ménages en tant que producteurs de biens et services pour usage propre
U Activités extra-territoriales

Travaillons maintenant sur les mots en eux-même.

20 mots les plus utilisés

Le nombre d’occurrences du mot sci représente 5.43% de la totalité, écrasant le reste de la distribution, avec 1 081 976 occurrences, qui descend à 198 313 pour le second mot sarl.

La présence de ce mot vient confirmer le constat effectué dans notre précédent article, dans lequel nous avions mis en évidence la forte représentation de l’activité L (Activités immobilières) en termes de nombre d’établissements.

Terminons par un nuage de mots, dans lequel nous avons volontairement exclu le mot sci, dont la présence aurait pour effet d’écraser les autres mots (la taille d’affichage étant proportionnelle au nombre d’occurrences).

Nuage de mots

Conclusion

Ainsi s’achève la première partie de notre série sur les noms des entreprises en Bretagne administrative.

La suite dans un prochain article.

Rédigé par: Michel Caradec

Rédacteur pour Data Bzh