⚠️ Annexe technique — résultats de recherche & développement (mesures fin mai 2026). Notre démarche est en phase de validation : nos résultats sont prometteurs mais pas encore prouvés statistiquement. Certaines mesures proviennent de simulations sur données synthétiques (signalées comme telles dans le texte) ; obtenir ces mêmes mesures sur corpus humain réel est précisément l'objet de la phase que nous cherchons à financer. Aucun chiffre n'est présenté au-dessus de la mesure réelle.

SOS Écrans · annexe technique & scientifique · mesures fin mai 2026

Shelkid — annexe technique
& scientifique complète

Toutes nos mesures, toutes nos expériences et tout notre socle scientifique, réunis en une seule page. Notre principe : exposer aussi clairement les forces que les limites, et ne jamais publier un chiffre que nous n'avons pas mesuré. Chaque chiffre ici a été mesuré, jamais estimé ni gonflé.

Note de lecture. Tous les chiffres sont mesurés sur des bancs de test indépendants de petite taille (~157 conversations pour le moteur champion) : ils sont indicatifs, avec des marges d'incertitude réelles, à reconfirmer sur un échantillon plus large. L'application a été validée sur émulateur ; la preuve finale se fera sur appareils réels. Shelkid est un outil d'écoute et d'orientation — il ne pose aucun diagnostic et ne remplace ni un adulte, ni un professionnel, ni les lignes d'aide (3018, 3114, 119, 15).

Conventions de lecture. On distingue toujours deux régimes : optimiste (chiffres réglés sur les données de test, flatteurs, à ne pas publier comme preuve) et sans fuite (mesuré sur un lot jamais vu, ni pour entraîner ni pour régler les seuils). On préfère le vrai au flatteur.

Niveau de preuve : 🧪 = synthétique / petit échantillon (données générées ou banc réduit : sert à piloter une direction, pas à certifier) · 🔬 = validé sur vrai corpus humain (la barre que nous visons). À ce jour, la grande majorité de nos chiffres sont 🧪 — c'est notre principale limite, et la raison du test terrain.

« Nous avons de bonnes raisons de penser que notre approche est juste ; nous n'avons encore aucune preuve qu'elle généralise sur de vrais adolescents. » — c'est précisément ce que nous voulons découvrir, avec un partenaire.

1 · Résultats clés — les deux grands chiffres

Le moteur distingue le danger explicite (un appel clair) du mal-être discret (le harcèlement répété, sans mot violent).

~100 %

Signal explicite détecté (idéation suicidaire formulée, grooming, sextorsion)

~20 %

Signal subtil détecté (harcèlement répété, isolement, sans insulte)

Lecture : le moteur protège bien contre le danger qui s'exprime ouvertement, mais reste largement sourd au signal faible. C'est le cœur de notre travail actuel. ⚠️ Ces chiffres sont mesurés sur un jeu de test scellé / synthétique. Le moteur réellement déployé aujourd'hui est plus modeste (voir la comparaison des moteurs plus bas) — nous ne le cachons pas.

🤫 Ce « signal subtil », c'est le murmure. Sa définition, sa typologie (A→F) et une rubrique de mesure honnête sont posées (principe clé : on mesure au niveau fil × fenêtre, pas message). → Dossier technique « Le Murmure » (méthode documentée en interne).

Quatre approches testées pour le signal subtil

Pourcentage de signaux subtils correctement détectés, pour chaque approche (banc Test B). La référence de départ est à 20 %.

Détection du signal subtil (%) — par approche

Lecture : quatre approches distinctes (apprentissage multi-tâches, lecture de la conversation entière, ajout de données réelles) plafonnent autour de 20–28 %. La meilleure progression vient de l'ajout de vraies conversations — mais en trop faible quantité, elle déséquilibre le modèle. Conclusion : le verrou n'est pas algorithmique, il est dans la donnée réelle disponible.

Taux de fausses alertes (faux positifs)

Sur des conversations parfaitement ordinaires, à quelle fréquence le moteur signale-t-il à tort ? À gauche en l'état ; à droite après réglage des seuils.

Réglage initial

Après calibration

Lecture : au réglage initial, ~12,7 % des conversations ordinaires déclenchaient au moins une fausse alerte (mesuré (non estimé) sur banc synthétique, n=63). Après calibration des seuils, ce taux tombe à 1,6 % — sept fois moins — sans perte sur la détection du danger grave.

La calibration : resserrer sans sacrifier l'essentiel

À mesure qu'on resserre les seuils (de gauche à droite), les fausses alertes chutent. La détection du danger grave reste préservée (proche de 100 % sur notre jeu de test scellé, échantillon limité). Seule la sensibilité au signal subtil diminue un peu.

Effet du réglage des seuils de décision

Lecture : il existe une réelle marge de réglage, et le danger grave est détecté quel que soit le seuil. Le point de fonctionnement exact (combien de fausses alertes tolérer pour ne pas manquer un signal subtil) relève d'une décision clinique, pas purement technique.

Comparaison des moteurs candidats (E5 vs double cerveau)

Deux moteurs étaient envisageables. Comparés sur le taux de fausses alertes (plus bas = meilleur).

Fausses alertes sur conversations ordinaires (%)

Lecture : le second candidat sur-déclenche massivement (88,9 % de fausses alertes) — inexploitable. Le moteur retenu (E5) reste à 1,6 %. Décision documentée et tracée selon notre protocole.

★ Nous avons déjà beaucoup testé — avec de vrais adolescents

Nous ne restons pas dans la théorie : à travers une douzaine de tests différents (en classe avec des adolescents, et en ligne), notre laboratoire a déjà recueilli plus de 1 000 contributions, en grande majorité de jeunes de 15 à 17 ans.

Premier enseignement, déjà net : le harcèlement voilé est indécidable sur un message isolé — même des juges humains ne s'accordent pas — mais il devient lisible au niveau de la conversation. C'est exactement le principe de notre moteur : juger le fil, pas le message seul.

Nous continuons — et c'est là que nous avons besoin d'aide. Des rapprochements universitaires, un cadre scientifique et l'élargissement de nos tests (notamment le volet « conversation », encore récent) transformeront ces premiers résultats prometteurs en validation solide. C'est l'objet de notre demande de soutien.

2 · L'ampleur du travail

Ces résultats ne sortent pas d'un essai unique. Ils reposent sur un travail d'entraînement et de mesure mené en continu.

15+

modèles d'IA entraînés et comparés (CamemBERT, DistilCamembert, mDeBERTa…)

110 M

paramètres dans le moteur retenu (E5), exécuté en 5–9 ms par message

~6 000

conversations d'adolescents générées et contrôlées pour l'entraînement

152 179

messages de détresse/soutien consolidés (corpus santé mentale)

Le moteur retenu a été entraîné sur ~52 000 exemples annotés (8 passages complets sur les données), soit des centaines de milliers d'étapes d'apprentissage et des milliards d'opérations. Chaque candidat est mesuré sur un banc indépendant, avant d'être retenu ou écarté selon un protocole anti-régression strict (aucun modèle ne remplace le précédent sans le battre).

3 · L'histoire des expériences (journal de bord)

L'historique honnête, étape par étape : ce qu'on a gagné, ce qu'on a cru gagner, ce qu'on a « perdu » en regardant la vérité — et ce qui ship réellement aujourd'hui.

⚠️ Ce qui protège l'enfant aujourd'hui

Le filet réellement déployé sur le téléphone des familles, c'est la ligne Kotlin Android (règles de vigilance + moteur E5 intégré). Tout le reste de ce journal — étage du temps, capteurs de silence/dissonance, mémoire sur plusieurs jours, double cerveau — est prospectif : modules candidats mesurés en laboratoire, pas encore branchés sur le déployé. Nous le disons franchement pour ne pas faire passer une direction de recherche pour une protection acquise.

Les cerveaux de Shelkid — état juin 2026

Shelkid est une application complète (et non une simple brique intégrable). Sa détection combine plusieurs « cerveaux », chacun avec un rôle et un niveau de maturité distinct — nous séparons toujours ce qui est déployé de ce qui est exploratoire :

① Règles de vigilance (déterministe, explicable) — repère le danger frontal (insulte, menace, contact inconnu). Déployé sur l'appareil.
② Modèle E5 (CamemBERT français, 3 niveaux RIEN / signal / alarme, affiné sur des messages d'ados réels) — déployé sur l'appareil ; le contenu ne sort jamais.
③ Étage du temps / trajectoire — agrège les signaux faibles sur plusieurs jours (le harcèlement se lit dans la répétition, pas dans un message isolé). Exploratoire, mesuré en labo, pas branché sur le déployé.
④ Modèle « murmure » — petit modèle embarquable (distillé d'un grand modèle) pour le harcèlement voilé. Exploratoire / en shadow (petit échantillon, n≈39, non déployé) : on ne met pas un détecteur non validé entre les mains d'enfants.
⑤ POULS (réaction au clavier) — signaux comportementaux on-device (latence, effacements…), jamais le contenu. Exploratoire / shadow.

Règle de vérité : le frontal fonctionne aujourd'hui ; le voilé (le « murmure ») reste un objectif de recherche, exploratoire. Le signal revient d'abord à l'enfant (il garde la main) ; il peut aller à un adulte de confiance choisi avec lui (pas le parent par défaut), jamais le contenu. Pas de finalité médicale (on oriente, on ne diagnostique pas).

L'étage du temps — avant / après

La crise et le grooming restent en alarme immédiate. Le harcèlement isolé devient un murmure (alarme s'il se répète). Mesuré sur le lot 4 (sans fuite). Les fausses alarmes passent de 44 % → 0 %, les cas graves restent à 100 %.

Avant / après l'étage du temps (lot 4 · sans fuite)

Le chemin dans le temps — réussites, reculs, projection

L'histoire vraie : on a gagné (double cerveau), on a cru gagner gros (16 % optimiste), on a « perdu » en regardant la vérité (44 % sans fuite) — puis vraiment gagné (étage du temps). Le pointillé = projection vers la validation humaine, pas une mesure.

Trajectoire des mesures dans le temps

Note : les points viennent de jeux de test différents selon l'époque — lire la tendance/histoire, pas la comparaison chiffre à chiffre.

Couverture par risque — ce que le cerveau actuel repère

Chaque barre = un risque. Vert = repéré, nommé & déployé. Bleu = nommé & mesuré en labo (synthétique) (Phase B faite), déploiement après validation des relais par les pros — radicalisation 100 %, pro-anorexie 92 %, drogues 83 % sur lots inédits. Orange = repéré, déjà servi par un voisin (sextorsion→grooming, détresse-ami→crise). Mesuré sur lots inédits.

Couverture par risque (lots inédits)

⚠️ « Repéré » ne veut pas dire « précis » : le banal déclenche aussi beaucoup (voir plus bas) — c'est l'étage du temps qui le ramène à un murmure. Données synthétiques, indicatif.

Détection par danger — deux régimes de lecture

Part des situations de chaque type que le moteur fait passer en alarme. « Adultes légitimes » = part correctement épargnée (test anti-faux-positif). Bascule entre le lot sans fuite et les juges (optimiste).

Vue des résultats :

Détection par danger (lot 4 · sans fuite)

Combien de données faut-il ? — la courbe d'apprentissage

On ré-entraîne le juge sur des tailles croissantes, mesuré sur le lot 4 (jamais vu). Verdict : détecter un danger plafonne dès ~250 exemples (le gros modèle fait le travail). Les fausses alarmes, elles, restent l'affamé — la donnée seule ne les règle pas (d'où l'étage du temps).

Courbe d'apprentissage (lot 4 · sans fuite)

La guerre du banal — chaque conversation normale apprise fait baisser les fausses alarmes

On a généré 511 conversations banales variées (vannes entre potes, exclamations dramatiques anodines…) et mesuré l'effet sur le lot 4. Fausses alarmes 56 % → 19 % (÷3), grooming et crise restent à 100 %. Ça plafonne vers 19 % → l'étage du temps finit le travail (→ 0 %). Le banal est l'affamé, mais il cède.

Fausses alarmes vs quantité de banal appris

Les mécanismes du grooming — ce que disent les données

Sur 1 581 conversations de grooming, les situations se regroupent en 8 mécanismes récurrents (et non en milliers de cas uniques). C'est ce qui rend la « dentelle » des messages possible.

8 mécanismes de grooming (sur 1 581 conversations)

La mécanique sur plusieurs jours — voir le danger monter sans alarmer une amitié

L'intuition d'Emmanuel : un enfant qui « passe à l'acte » a souvent été chambré plusieurs jours d'affilée, sur plusieurs canaux. L'étage du temps v2 garde une mémoire de 3 jours et pèse chaque signal par sa gravité : un danger qui s'installe finit par franchir le seuil, alors qu'une amitié qui se vanne tous les jours reste sous le radar. Mesuré sur 70 scénarios sur 3 à 10 jours générés exprès (dont 25 « pièges » sains).

Étage du temps v2 — % des cas montés en alarme

Config retenue : mémoire 3 jours, seuil 2.0. Sur ces 70 scénarios synthétiques, l'étage a fait monter en alarme 39 des 45 dangers et donné 3 faux sur 25 sains — tous des « mauvaises passes » (tristesse passagère) en murmure doux, jamais une alarme dure ; chambrage amical 0/15. ⚠️ Données synthétiques (générées par IA) → une DIRECTION, pas une efficacité prouvée. Ce test ne mesure qu'un seul cerveau (l'étage du temps), pas le produit. À ne pas confondre avec une « efficacité globale » : un premier chiffre global a d'ailleurs été publiquement démonté par notre propre audit — l'efficacité globale n'est pas démontrée à ce stade. Module candidat, non déployé.

Les 4 couches d'écoute — le silence et la dissonance (données d'Emmanuel · sans fuite)

On a découvert deux angles morts (l'enfant qui se tait, la détresse masquée sous l'humour) et on les a comblés sans baisser le seuil — en ajoutant des signaux nouveaux : le silence (la parole qui s'effondre), puis la dissonance (ton léger collé à un contenu lourd). Dangers captés 58 % → 72 % → 83 %, fausses alarmes 3 % sur corpus synthétique · 22,5 % sur corpus réel mixte (voir comparaison des 3 moteurs ci-dessous).

Couches d'écoute — dangers captés vs fausses alarmes

Mesuré sur 71 scénarios synthétiques (retrait silencieux 0/8 → 6/8 ; détresse masquée 6/14 → 11/14). Modules candidats (capteur-silence.js, capteur-dissonance.js, moteur-couches.js), non branchés sur le déployé. Direction prouvée, pas certifiée.

Pourquoi on ne baisse PAS le seuil

La tentation, pour attraper plus, serait d'abaisser le seuil d'alerte. Mais c'est crier au loup : à seuil 1.0 on capte 93 % des dangers… au prix de 67 % de fausses alarmes (2 enfants sur 3 qui vont bien seraient signalés). On garde donc le seuil, et on attrape plus en ajoutant des signaux, jamais en baissant la barre.

Dangers captés vs fausses alarmes quand le seuil descend

Le bon réglage (seuil 2.0) tient les fausses alarmes à 3 % sur corpus synthétique. Sur corpus réel mixte (slang ado authentique) : 22,5 %, en cours de réduction.

Comparaison des 3 moteurs — état réel mesuré (fin mai 2026)

Sur 1 250 conversations annotées (mega-corpus 30/05), 3 moteurs mesurés indépendamment. C'est l'état le plus brut de ce qui existe — y compris ce qui ship réellement aux parents.

Moteur	Rappel RED	Précision	Faux positifs
Kotlin Android (ce qui ship aux parents)	25,4 %	46,1 %	27,3 %
Worker shield-detect	34 %	59 %	21 %
Extension JS (ML)	96,8 %*	—	22,5 %*

* extension JS = corpus partiel 176 cas. À re-mesurer sur le mega-corpus. Avant publication grand public : passage par un moteur LLM (Claude Haiku en API) puis fine-tune dédié sur ~500 000 cas humains publics (Van Hee, Jigsaw, eRisk). Objectif : rappel ≥ 85 %, FP ≤ 12 %.

À lire honnêtement : ce qui protège l'enfant aujourd'hui = la ligne Kotlin (rappel RED encore modeste, FP encore élevé). Les meilleurs chiffres de cette annexe (extension JS, étage du temps, couches) sont prospectifs — des directions mesurées en laboratoire, pas encore le filet déployé. Le moteur champion E5 (synthèse ci-dessus) est la brique d'IA destinée à remonter ces chiffres une fois la donnée réelle disponible.

À lire honnêtement (et à dire tel quel à un expert) :
• Sans fuite = le 4ᵉ lot (50 conversations générées par une IA différente, jamais utilisées ni pour entraîner ni pour régler les seuils) → mesure fiable.
• Optimiste = les 3 juges, sur lesquels les seuils de décision ont été calés → chiffres flatteurs, à ne pas publier comme preuve.
• Ces lots sont synthétiques (générés par IA). Même excellents, ils ne remplacent pas un corpus humain annoté (CyberAgressionAdo, Ollagnier) — c'est le juge ultime, encore à venir.
• Conséquence assumée : aucun pourcentage dans les courriers tant que la validation humaine n'est pas faite. Cette annexe est notre tableau de bord interne de pilotage, partagé en toute transparence.

Sources internes : lot 4, juges, corpus grooming-fr-synth (1 581 conv), fidélité JS=Python 258/258. Détail complet et daté (méthode documentée en interne).

4 · Ce que nous voulons vraiment mesurer : le résultat humain

Un système peut être techniquement parfait — détection juste, zéro fausse alerte — et pourtant humainement mauvais : si le parent réagit mal, si l'enfant se ferme, si la relation se dégrade. Le rappel et la précision ne disent rien de cela.

Nous pensons que la vraie mesure de Shelkid n'est pas une métrique d'intelligence artificielle, mais une mesure humaine :

Une discussion parent-enfant s'est-elle ouverte ?
L'enfant s'est-il senti écouté, et non surveillé ?
Une demande d'aide a-t-elle abouti — une orientation vers un adulte de confiance, vers le 3018 ?

Nous ne savons pas encore mesurer cela seuls. C'est exactement ce que votre expertise permettrait de construire avec nous : placer l'enfant — et non la performance — au centre de l'évaluation.

5 · Nos besoins — ce que ce financement rend possible

Cette annexe le montre : le moteur protège déjà bien contre le danger explicite, et le verrou du signal subtil n'est pas algorithmique — il est dans la donnée réelle, annotée, disponible. C'est exactement ce que ce financement permet de lever.

Collecter et annoter de la donnée réelle (tests de terrain encadrés, double annotation) — le seul levier prouvé pour faire progresser la détection du signal subtil.
Valider scientifiquement : partenariats avec des équipes de recherche (que nous recherchons), protocole de benchmark pré-enregistré, mesure honnête des faux positifs et des faux négatifs.
Sécuriser la conformité : DPO, AIPD, base légale, consentement parental — un impératif pour des données de mineurs.
Structurer l'équipe : une coordination, pour ne plus dépendre du seul fondateur.
Déployer et mesurer le résultat humain : un enfant effectivement orienté vers un adulte de confiance ou le 3018.

Notre feuille de route — et les besoins, phase par phase

Chaque phase est finançable séparément : un partenaire peut soutenir une étape précise ou l'ensemble. Montants indicatifs, ajustés à chaque appel à projets.

Mois 1-3 · Sécuriser le cadre≈ 6 000 €

Conformité RGPD : DPO, AIPD, base légale, consentement parental — impératif pour des données de mineurs.

Mois 2-9 · Collecter le réel≈ 12 000 €

Tests de terrain encadrés (établissements) + collecte et double annotation de conversations réelles — le verrou n°1 de la détection du signal voilé.

Mois 6-12 · Valider scientifiquement≈ 9 000 €

Partenariats universitaires, protocole de benchmark pré-enregistré, mesure honnête des faux positifs et des faux négatifs.

Mois 9-15 · Structurer & préparer le déploiement≈ 8 000 €

Coordination (ne plus dépendre du seul fondateur) et préparation du déploiement, qui restera gratuit pour les familles.

Enveloppe indicative : ≈ 35 000 € sur 12-15 mois (modulable). Chaque partenaire choisit la ou les tranches qu'il souhaite financer — une phase, plusieurs, ou l'ensemble ; le montant s'ajuste à votre appel à projets.

Sans ce soutien, le travail reste un prototype prometteur. Avec lui, il devient un outil validé, déployable — et gratuit.

6 · Le socle scientifique complet

On ne part pas d'une intuition isolée. L'outil est aligné sur la littérature internationale sur le harcèlement dans le temps : c'est elle qui établit que la répétition et la pente qui monte font la gravité. Toutes les sources ci-dessous ont été vérifiées sur l'original ; les chiffres non confirmés ont été écartés. Nous indiquons la source à chaque fois — et son statut (établi, ou encore à valider).

① L'ampleur du problème (sources françaises)

≈ 18 % des jeunes déclarent avoir été cyberharcelés ; 37 % du harcèlement et/ou cyberharcèlement — INSEE Références 2025 / DEPP, et l'étude e-Enfance/3018 – Caisse d'Épargne – Audirep (mai 2025).
25 % des 6-18 ans victimes ont déjà pensé au suicide ou à l'automutilation (39 % des filles) — e-Enfance / Caisse d'Épargne, 2025. Le suicide est la 2ᵉ cause de décès des 15-24 ans (Santé publique France, 2023). Chiffres maniés avec sobriété.
Le lien cyber-victimation → idéation suicidaire est confirmé par méta-analyses (European Child & Adolescent Psychiatry, 2022).

② Le lien harcèlement → suicide (méta-analyses & cohortes longitudinales)

Méta-analyses

van Geel, Vedder & Tanilon (2014), JAMA Pediatrics — cyber > classique sur l'idéation suicidaire (OR 3,12 vs 2,16 ; n=284 375)

Holt et al. (2015), Pediatrics — idéation OR 2,34 ; comportements OR 2,94

Moore et al. (2017), World J Psychiatry — lien probable tabac/drogues

Reijntjes et al. (2010 / 2011) — internalisation & externalisation, longitudinal, bidirectionnel

Cohortes longitudinales

Copeland et al. (2013), JAMA Psychiatry — bully-victims, risque maximal

Lereya et al. (2013), JAACAP — ALSPAC : harcèlement 7-10 ans → automutilation 16-17 ans

Takizawa et al. (2014), Am J Psychiatry — suivi 50 ans, dose-réponse

Geoffroy et al. (2018 CMAJ ; 2022 Psych Medicine) — trajectoire sévère, décès par suicide

Klomek et al. (2009) ; Baldwin et al. (2019, jumeaux E-Risk) ; Maurya et al. (2022, cyber, suivi 3 ans)

③ Les trajectoires — « la pente qui monte »

Rudolph et al. (2011) — la victimisation croissante a un effet propre, indépendant du niveau initial.
Ettekal et al. (2022) — les trajectoires décroissantes récupèrent → intervenir tôt.
Barker et al. (2008) — trajectoire croissante + double rôle = plus d'automutilation.
Nylund et al. (2007) ; Finkelhor et al. (2007) — polyvictimisation : la dose fait le poison.

④ Le harcèlement, un phénomène de groupe (fondement de notre pédagogie)

Christina Salmivalli — « Bullying as a group process » (1996) et le Participant Role Questionnaire (Salmivalli & Voeten, 2004) : chacun tient un rôle (meneur, renforçateur, témoin, défenseur). D'où notre signature : placer le témoin au centre.
KiVa (Kärnä et al.) — l'un des programmes anti-harcèlement les mieux validés par essais contrôlés ; nous citons aussi, honnêtement, le RCT gallois (2020) sans effet significatif sur le critère principal.
DABSS (Sargioti et al., 2022, programme FUSE) et Olweus (définition fondatrice, OBVQ) — pour la logique de nos échelles d'auto-évaluation.

⑤ Le cadre français du (cyber)harcèlement

Catherine Blaya (La cyberviolence, PUF 2025 ; EU Kids Online France) — cyberviolence, « absence de répit » école↔écran. Et Éric Debarbieux (climat scolaire, UNICEF 2011). Statut honnête : ils n'ont pas été sollicités à ce jour ; ce ne sont pas des cautions. Travaux que nous lisons et souhaitons soumettre à leur regard critique. Voir aussi Catheline (PUF) ; Galand (2017).
Dataset CyberAgressionAdo (Ollagnier, Cabrio, Villata & Blaya, LREC 2022) — notre corpus de validation en français.

⑥ Détection des signaux faibles (grooming, manipulation)

Appui sur Street et al. (2024), les travaux d'O'Connell et le BF-PSR Framework (Université de São Paulo). Statut honnête : ces motifs ne sont pas encore validés sur un corpus français annoté — couche en développement.

⑦ Recommandations officielles & déontologie

HAS — protocole « sentinelle / acteur non clinicien » (écoute + orientation) : la place exacte de Shelkid.
OMS — soutient la prévention « par plateformes numériques » et l'IA de détection « tant que l'humain reste au centre ». Voir aussi OMS-HBSC 2024.
USPSTF / NICE — mettent en garde contre le dépistage et la prédiction du risque. Shelkid n'est ni un dépistage, ni un prédicteur, ni un substitut clinique — un déclencheur d'écoute et d'orientation, non diagnostique.
Institutionnel : CDC / StopBullying ; UNESCO 2019 ; UNICEF ; eSafety (AU) ; Éducation nationale / programme pHARe ; Santé publique France (Enabee).

Sources complètes & revue de presse : Sources scientifiques & revue de presse. Démarche, méthode & éthique : Note méthodologique. Revue hiérarchisée par niveau de preuve (méthode documentée en interne). Cette base est citée à l'identique dans nos courriers et nos restitutions.

7 · Éthique & cadre juridique (déjà préparé)

Sans finalité médicale, sans diagnostic — finalité déclarée posée par écrit.
Sur l'appareil — le texte des messages n'est pas envoyé sur un serveur (privacy by design).
Consentement parental + accord de l'enfant — documents rédigés ; aucune surveillance cachée.
Analyse d'impact (AIPD) en cours ; humain dans la boucle (l'outil suggère, l'humain décide).

Architecture à trois étages — preuve mesurée : une idéation suicidaire formulée (« je veux me suicider ») est classée « rien » par le modèle statistique seul, mais déclenchée en ROUGE par les règles ; la combinaison retient toujours le niveau le plus prudent. Aucun étage seul ne suffit.

Étage 1 — Règles en place

Repère le signal explicite. Filet de sécurité indispensable pour la crise.

Étage 2 — Modèle E5 intégré

Repère la nuance (grooming, harcèlement sans insulte). 5–9 ms sur smartphone.

Étage 3 — Dimension temporelle à venir

La répétition dans la durée. Visera le signal subtil, là où la donnée réelle est nécessaire.

Mesures du moteur E5_QUALITY et expériences associées, bancs de test indépendants (n≈157 pour le moteur champion ; lots et corpus synthétiques détaillés ci-dessus), fin mai 2026. Petit échantillon → marges d'incertitude larges, à reconfirmer sur corpus humain. Le signal subtil reste un problème de recherche ouvert, y compris dans la littérature scientifique ; nous ne prétendons pas l'avoir résolu. Ce qui protège l'enfant aujourd'hui = la ligne Kotlin déployée ; le reste est prospectif. Document de travail — ne pas diffuser sans l'accord de l'association. SOS Écrans — association loi 1901 (W751283606). Shelkid : outil gratuit d'écoute et d'orientation, sans finalité médicale, sans diagnostic, avec un humain au centre.

Shelkid — annexe technique& scientifique complète