Shelkid — annexe technique
& scientifique complète
Toutes nos mesures, toutes nos expériences et tout notre socle scientifique, réunis en une seule page. Notre principe : exposer aussi clairement les forces que les limites, et ne jamais publier un chiffre que nous n'avons pas mesuré. Chaque chiffre ici a été mesuré, jamais estimé ni gonflé.
Conventions de lecture. On distingue toujours deux régimes : optimiste (chiffres réglés sur les données de test, flatteurs, à ne pas publier comme preuve) et sans fuite (mesuré sur un lot jamais vu, ni pour entraîner ni pour régler les seuils). On préfère le vrai au flatteur.
Niveau de preuve : 🧪 = synthétique / petit échantillon (données générées ou banc réduit : sert à piloter une direction, pas à certifier) · 🔬 = validé sur vrai corpus humain (la barre que nous visons). À ce jour, la grande majorité de nos chiffres sont 🧪 — c'est notre principale limite, et la raison du test terrain.
1 · Résultats clés — les deux grands chiffres
Le moteur distingue le danger explicite (un appel clair) du mal-être discret (le harcèlement répété, sans mot violent).
Quatre approches testées pour le signal subtil
Pourcentage de signaux subtils correctement détectés, pour chaque approche (banc Test B). La référence de départ est à 20 %.
Détection du signal subtil (%) — par approche
Taux de fausses alertes (faux positifs)
Sur des conversations parfaitement ordinaires, à quelle fréquence le moteur signale-t-il à tort ? À gauche en l'état ; à droite après réglage des seuils.
Réglage initial
Après calibration
La calibration : resserrer sans sacrifier l'essentiel
À mesure qu'on resserre les seuils (de gauche à droite), les fausses alertes chutent. La détection du danger grave reste préservée (proche de 100 % sur notre jeu de test scellé, échantillon limité). Seule la sensibilité au signal subtil diminue un peu.
Effet du réglage des seuils de décision
Comparaison des moteurs candidats (E5 vs double cerveau)
Deux moteurs étaient envisageables. Comparés sur le taux de fausses alertes (plus bas = meilleur).
Fausses alertes sur conversations ordinaires (%)
★ Nous avons déjà beaucoup testé — avec de vrais adolescents
Nous ne restons pas dans la théorie : à travers une douzaine de tests différents (en classe avec des adolescents, et en ligne), notre laboratoire a déjà recueilli plus de 1 000 contributions, en grande majorité de jeunes de 15 à 17 ans.
2 · L'ampleur du travail
Ces résultats ne sortent pas d'un essai unique. Ils reposent sur un travail d'entraînement et de mesure mené en continu.
3 · L'histoire des expériences (journal de bord)
L'historique honnête, étape par étape : ce qu'on a gagné, ce qu'on a cru gagner, ce qu'on a « perdu » en regardant la vérité — et ce qui ship réellement aujourd'hui.
Le filet réellement déployé sur le téléphone des familles, c'est la ligne Kotlin Android (règles de vigilance + moteur E5 intégré). Tout le reste de ce journal — étage du temps, capteurs de silence/dissonance, mémoire sur plusieurs jours, double cerveau — est prospectif : modules candidats mesurés en laboratoire, pas encore branchés sur le déployé. Nous le disons franchement pour ne pas faire passer une direction de recherche pour une protection acquise.
Les cerveaux de Shelkid — état juin 2026
Shelkid est une application complète (et non une simple brique intégrable). Sa détection combine plusieurs « cerveaux », chacun avec un rôle et un niveau de maturité distinct — nous séparons toujours ce qui est déployé de ce qui est exploratoire :
- ① Règles de vigilance (déterministe, explicable) — repère le danger frontal (insulte, menace, contact inconnu). Déployé sur l'appareil.
- ② Modèle E5 (CamemBERT français, 3 niveaux RIEN / signal / alarme, affiné sur des messages d'ados réels) — déployé sur l'appareil ; le contenu ne sort jamais.
- ③ Étage du temps / trajectoire — agrège les signaux faibles sur plusieurs jours (le harcèlement se lit dans la répétition, pas dans un message isolé). Exploratoire, mesuré en labo, pas branché sur le déployé.
- ④ Modèle « murmure » — petit modèle embarquable (distillé d'un grand modèle) pour le harcèlement voilé. Exploratoire / en shadow (petit échantillon, n≈39, non déployé) : on ne met pas un détecteur non validé entre les mains d'enfants.
- ⑤ POULS (réaction au clavier) — signaux comportementaux on-device (latence, effacements…), jamais le contenu. Exploratoire / shadow.
Règle de vérité : le frontal fonctionne aujourd'hui ; le voilé (le « murmure ») reste un objectif de recherche, exploratoire. Le signal revient d'abord à l'enfant (il garde la main) ; il peut aller à un adulte de confiance choisi avec lui (pas le parent par défaut), jamais le contenu. Pas de finalité médicale (on oriente, on ne diagnostique pas).
L'étage du temps — avant / après
La crise et le grooming restent en alarme immédiate. Le harcèlement isolé devient un murmure (alarme s'il se répète). Mesuré sur le lot 4 (sans fuite). Les fausses alarmes passent de 44 % → 0 %, les cas graves restent à 100 %.
Avant / après l'étage du temps (lot 4 · sans fuite)
Le chemin dans le temps — réussites, reculs, projection
L'histoire vraie : on a gagné (double cerveau), on a cru gagner gros (16 % optimiste), on a « perdu » en regardant la vérité (44 % sans fuite) — puis vraiment gagné (étage du temps). Le pointillé = projection vers la validation humaine, pas une mesure.
Trajectoire des mesures dans le temps
Note : les points viennent de jeux de test différents selon l'époque — lire la tendance/histoire, pas la comparaison chiffre à chiffre.
Couverture par risque — ce que le cerveau actuel repère
Chaque barre = un risque. Vert = repéré, nommé & déployé. Bleu = nommé & mesuré en labo (synthétique) (Phase B faite), déploiement après validation des relais par les pros — radicalisation 100 %, pro-anorexie 92 %, drogues 83 % sur lots inédits. Orange = repéré, déjà servi par un voisin (sextorsion→grooming, détresse-ami→crise). Mesuré sur lots inédits.
Couverture par risque (lots inédits)
⚠️ « Repéré » ne veut pas dire « précis » : le banal déclenche aussi beaucoup (voir plus bas) — c'est l'étage du temps qui le ramène à un murmure. Données synthétiques, indicatif.
Détection par danger — deux régimes de lecture
Part des situations de chaque type que le moteur fait passer en alarme. « Adultes légitimes » = part correctement épargnée (test anti-faux-positif). Bascule entre le lot sans fuite et les juges (optimiste).
Détection par danger (lot 4 · sans fuite)
Combien de données faut-il ? — la courbe d'apprentissage
On ré-entraîne le juge sur des tailles croissantes, mesuré sur le lot 4 (jamais vu). Verdict : détecter un danger plafonne dès ~250 exemples (le gros modèle fait le travail). Les fausses alarmes, elles, restent l'affamé — la donnée seule ne les règle pas (d'où l'étage du temps).
Courbe d'apprentissage (lot 4 · sans fuite)
La guerre du banal — chaque conversation normale apprise fait baisser les fausses alarmes
On a généré 511 conversations banales variées (vannes entre potes, exclamations dramatiques anodines…) et mesuré l'effet sur le lot 4. Fausses alarmes 56 % → 19 % (÷3), grooming et crise restent à 100 %. Ça plafonne vers 19 % → l'étage du temps finit le travail (→ 0 %). Le banal est l'affamé, mais il cède.
Fausses alarmes vs quantité de banal appris
Les mécanismes du grooming — ce que disent les données
Sur 1 581 conversations de grooming, les situations se regroupent en 8 mécanismes récurrents (et non en milliers de cas uniques). C'est ce qui rend la « dentelle » des messages possible.
8 mécanismes de grooming (sur 1 581 conversations)
La mécanique sur plusieurs jours — voir le danger monter sans alarmer une amitié
L'intuition d'Emmanuel : un enfant qui « passe à l'acte » a souvent été chambré plusieurs jours d'affilée, sur plusieurs canaux. L'étage du temps v2 garde une mémoire de 3 jours et pèse chaque signal par sa gravité : un danger qui s'installe finit par franchir le seuil, alors qu'une amitié qui se vanne tous les jours reste sous le radar. Mesuré sur 70 scénarios sur 3 à 10 jours générés exprès (dont 25 « pièges » sains).
Étage du temps v2 — % des cas montés en alarme
Config retenue : mémoire 3 jours, seuil 2.0. Sur ces 70 scénarios synthétiques, l'étage a fait monter en alarme 39 des 45 dangers et donné 3 faux sur 25 sains — tous des « mauvaises passes » (tristesse passagère) en murmure doux, jamais une alarme dure ; chambrage amical 0/15. ⚠️ Données synthétiques (générées par IA) → une DIRECTION, pas une efficacité prouvée. Ce test ne mesure qu'un seul cerveau (l'étage du temps), pas le produit. À ne pas confondre avec une « efficacité globale » : un premier chiffre global a d'ailleurs été publiquement démonté par notre propre audit — l'efficacité globale n'est pas démontrée à ce stade. Module candidat, non déployé.
Les 4 couches d'écoute — le silence et la dissonance (données d'Emmanuel · sans fuite)
On a découvert deux angles morts (l'enfant qui se tait, la détresse masquée sous l'humour) et on les a comblés sans baisser le seuil — en ajoutant des signaux nouveaux : le silence (la parole qui s'effondre), puis la dissonance (ton léger collé à un contenu lourd). Dangers captés 58 % → 72 % → 83 %, fausses alarmes 3 % sur corpus synthétique · 22,5 % sur corpus réel mixte (voir comparaison des 3 moteurs ci-dessous).
Couches d'écoute — dangers captés vs fausses alarmes
Mesuré sur 71 scénarios synthétiques (retrait silencieux 0/8 → 6/8 ; détresse masquée 6/14 → 11/14). Modules candidats (capteur-silence.js, capteur-dissonance.js, moteur-couches.js), non branchés sur le déployé. Direction prouvée, pas certifiée.
Pourquoi on ne baisse PAS le seuil
La tentation, pour attraper plus, serait d'abaisser le seuil d'alerte. Mais c'est crier au loup : à seuil 1.0 on capte 93 % des dangers… au prix de 67 % de fausses alarmes (2 enfants sur 3 qui vont bien seraient signalés). On garde donc le seuil, et on attrape plus en ajoutant des signaux, jamais en baissant la barre.
Dangers captés vs fausses alarmes quand le seuil descend
Le bon réglage (seuil 2.0) tient les fausses alarmes à 3 % sur corpus synthétique. Sur corpus réel mixte (slang ado authentique) : 22,5 %, en cours de réduction.
Comparaison des 3 moteurs — état réel mesuré (fin mai 2026)
Sur 1 250 conversations annotées (mega-corpus 30/05), 3 moteurs mesurés indépendamment. C'est l'état le plus brut de ce qui existe — y compris ce qui ship réellement aux parents.
| Moteur | Rappel RED | Précision | Faux positifs |
|---|---|---|---|
| Kotlin Android (ce qui ship aux parents) | 25,4 % | 46,1 % | 27,3 % |
| Worker shield-detect | 34 % | 59 % | 21 % |
| Extension JS (ML) | 96,8 %* | — | 22,5 %* |
* extension JS = corpus partiel 176 cas. À re-mesurer sur le mega-corpus. Avant publication grand public : passage par un moteur LLM (Claude Haiku en API) puis fine-tune dédié sur ~500 000 cas humains publics (Van Hee, Jigsaw, eRisk). Objectif : rappel ≥ 85 %, FP ≤ 12 %.
• Sans fuite = le 4ᵉ lot (50 conversations générées par une IA différente, jamais utilisées ni pour entraîner ni pour régler les seuils) → mesure fiable.
• Optimiste = les 3 juges, sur lesquels les seuils de décision ont été calés → chiffres flatteurs, à ne pas publier comme preuve.
• Ces lots sont synthétiques (générés par IA). Même excellents, ils ne remplacent pas un corpus humain annoté (CyberAgressionAdo, Ollagnier) — c'est le juge ultime, encore à venir.
• Conséquence assumée : aucun pourcentage dans les courriers tant que la validation humaine n'est pas faite. Cette annexe est notre tableau de bord interne de pilotage, partagé en toute transparence.
4 · Ce que nous voulons vraiment mesurer : le résultat humain
Un système peut être techniquement parfait — détection juste, zéro fausse alerte — et pourtant humainement mauvais : si le parent réagit mal, si l'enfant se ferme, si la relation se dégrade. Le rappel et la précision ne disent rien de cela.
Nous pensons que la vraie mesure de Shelkid n'est pas une métrique d'intelligence artificielle, mais une mesure humaine :
- Une discussion parent-enfant s'est-elle ouverte ?
- L'enfant s'est-il senti écouté, et non surveillé ?
- Une demande d'aide a-t-elle abouti — une orientation vers un adulte de confiance, vers le 3018 ?
Nous ne savons pas encore mesurer cela seuls. C'est exactement ce que votre expertise permettrait de construire avec nous : placer l'enfant — et non la performance — au centre de l'évaluation.
5 · Nos besoins — ce que ce financement rend possible
Cette annexe le montre : le moteur protège déjà bien contre le danger explicite, et le verrou du signal subtil n'est pas algorithmique — il est dans la donnée réelle, annotée, disponible. C'est exactement ce que ce financement permet de lever.
- Collecter et annoter de la donnée réelle (tests de terrain encadrés, double annotation) — le seul levier prouvé pour faire progresser la détection du signal subtil.
- Valider scientifiquement : partenariats avec des équipes de recherche (que nous recherchons), protocole de benchmark pré-enregistré, mesure honnête des faux positifs et des faux négatifs.
- Sécuriser la conformité : DPO, AIPD, base légale, consentement parental — un impératif pour des données de mineurs.
- Structurer l'équipe : une coordination, pour ne plus dépendre du seul fondateur.
- Déployer et mesurer le résultat humain : un enfant effectivement orienté vers un adulte de confiance ou le 3018.
Notre feuille de route — et les besoins, phase par phase
Chaque phase est finançable séparément : un partenaire peut soutenir une étape précise ou l'ensemble. Montants indicatifs, ajustés à chaque appel à projets.
Enveloppe indicative : ≈ 35 000 € sur 12-15 mois (modulable). Chaque partenaire choisit la ou les tranches qu'il souhaite financer — une phase, plusieurs, ou l'ensemble ; le montant s'ajuste à votre appel à projets.
6 · Le socle scientifique complet
On ne part pas d'une intuition isolée. L'outil est aligné sur la littérature internationale sur le harcèlement dans le temps : c'est elle qui établit que la répétition et la pente qui monte font la gravité. Toutes les sources ci-dessous ont été vérifiées sur l'original ; les chiffres non confirmés ont été écartés. Nous indiquons la source à chaque fois — et son statut (établi, ou encore à valider).
① L'ampleur du problème (sources françaises)
- ≈ 18 % des jeunes déclarent avoir été cyberharcelés ; 37 % du harcèlement et/ou cyberharcèlement — INSEE Références 2025 / DEPP, et l'étude e-Enfance/3018 – Caisse d'Épargne – Audirep (mai 2025).
- 25 % des 6-18 ans victimes ont déjà pensé au suicide ou à l'automutilation (39 % des filles) — e-Enfance / Caisse d'Épargne, 2025. Le suicide est la 2ᵉ cause de décès des 15-24 ans (Santé publique France, 2023). Chiffres maniés avec sobriété.
- Le lien cyber-victimation → idéation suicidaire est confirmé par méta-analyses (European Child & Adolescent Psychiatry, 2022).
② Le lien harcèlement → suicide (méta-analyses & cohortes longitudinales)
③ Les trajectoires — « la pente qui monte »
- Rudolph et al. (2011) — la victimisation croissante a un effet propre, indépendant du niveau initial.
- Ettekal et al. (2022) — les trajectoires décroissantes récupèrent → intervenir tôt.
- Barker et al. (2008) — trajectoire croissante + double rôle = plus d'automutilation.
- Nylund et al. (2007) ; Finkelhor et al. (2007) — polyvictimisation : la dose fait le poison.
④ Le harcèlement, un phénomène de groupe (fondement de notre pédagogie)
- Christina Salmivalli — « Bullying as a group process » (1996) et le Participant Role Questionnaire (Salmivalli & Voeten, 2004) : chacun tient un rôle (meneur, renforçateur, témoin, défenseur). D'où notre signature : placer le témoin au centre.
- KiVa (Kärnä et al.) — l'un des programmes anti-harcèlement les mieux validés par essais contrôlés ; nous citons aussi, honnêtement, le RCT gallois (2020) sans effet significatif sur le critère principal.
- DABSS (Sargioti et al., 2022, programme FUSE) et Olweus (définition fondatrice, OBVQ) — pour la logique de nos échelles d'auto-évaluation.
⑤ Le cadre français du (cyber)harcèlement
- Catherine Blaya (La cyberviolence, PUF 2025 ; EU Kids Online France) — cyberviolence, « absence de répit » école↔écran. Et Éric Debarbieux (climat scolaire, UNICEF 2011). Statut honnête : ils n'ont pas été sollicités à ce jour ; ce ne sont pas des cautions. Travaux que nous lisons et souhaitons soumettre à leur regard critique. Voir aussi Catheline (PUF) ; Galand (2017).
- Dataset CyberAgressionAdo (Ollagnier, Cabrio, Villata & Blaya, LREC 2022) — notre corpus de validation en français.
⑥ Détection des signaux faibles (grooming, manipulation)
- Appui sur Street et al. (2024), les travaux d'O'Connell et le BF-PSR Framework (Université de São Paulo). Statut honnête : ces motifs ne sont pas encore validés sur un corpus français annoté — couche en développement.
⑦ Recommandations officielles & déontologie
- HAS — protocole « sentinelle / acteur non clinicien » (écoute + orientation) : la place exacte de Shelkid.
- OMS — soutient la prévention « par plateformes numériques » et l'IA de détection « tant que l'humain reste au centre ». Voir aussi OMS-HBSC 2024.
- USPSTF / NICE — mettent en garde contre le dépistage et la prédiction du risque. Shelkid n'est ni un dépistage, ni un prédicteur, ni un substitut clinique — un déclencheur d'écoute et d'orientation, non diagnostique.
- Institutionnel : CDC / StopBullying ; UNESCO 2019 ; UNICEF ; eSafety (AU) ; Éducation nationale / programme pHARe ; Santé publique France (Enabee).
Sources complètes & revue de presse : Sources scientifiques & revue de presse. Démarche, méthode & éthique : Note méthodologique. Revue hiérarchisée par niveau de preuve (méthode documentée en interne). Cette base est citée à l'identique dans nos courriers et nos restitutions.
7 · Éthique & cadre juridique (déjà préparé)
- Sans finalité médicale, sans diagnostic — finalité déclarée posée par écrit.
- Sur l'appareil — le texte des messages n'est pas envoyé sur un serveur (privacy by design).
- Consentement parental + accord de l'enfant — documents rédigés ; aucune surveillance cachée.
- Analyse d'impact (AIPD) en cours ; humain dans la boucle (l'outil suggère, l'humain décide).
Shelkid · SOS Écrans