Tom: audio & vidéo en texte
iOS Universel / Productivité
Transcrivez audio et vidéo avec le moteur adapté au travail — trois options, toutes 100 % sur l'appareil.
Tom transforme le son en texte propre et modifiable directement sur votre iPhone. Cours, notes vocales WhatsApp, enregistrements d'écran, entretiens, podcasts, longues réunions — choisissez le moteur, déposez le fichier, lisez la transcription. Pas de compte, pas d'envoi, pas d'abonnement.
Conçu à l'origine pour un ami sourd, Tom s'adresse à toute personne qui a besoin de lire ce qui a été dit.
CHOISISSEZ VOTRE MOTEUR
• Apple Speech — rapide, peu de mémoire, intégré à iOS. Excellent par défaut pour l'enregistrement en direct et les fichiers courts. 25 langues.
• Whisper — le moteur de reconnaissance d'OpenAI, en local. Six tailles, de Tiny (80 Mo) à Large v3 (3,1 Go), incluant Turbo pour le meilleur compromis vitesse/qualité. Jusqu'à 99 langues.
• Parakeet v3 — transcription européenne haute précision de FluidAudio, sur l'appareil. 25 langues européennes. Apple Silicon, iOS 17+.
Résultat insatisfaisant ? Re-transcrivez le même fichier avec un autre moteur en un tap — la version précédente est conservée dans l'historique, vous pouvez comparer et revenir en arrière.
FONCTIONNALITÉS CLÉS
• Enregistrement en direct — touchez une fois et regardez la transcription apparaître pendant que vous parlez.
• Importation de fichiers — toute vidéo de votre photothèque, ou fichiers audio depuis Fichiers (y compris les notes vocales WhatsApp enregistrées dans Fichiers).
• Plusieurs moteurs + re-transcription — choisissez Apple Speech, Whisper ou Parakeet par fichier, et relancez le même audio via un autre moteur sans perdre la transcription précédente.
• Segments éditables — appui long sur un segment pour corriger un mot mal reconnu. Votre correction reste sur l'appareil.
• Export de sous-titres — enregistrez toute transcription en texte brut, SubRip (.srt) ou WebVTT (.vtt) pour des vidéos accessibles.
• Lecteur avec commandes intelligentes — touchez pour naviguer, suivez le segment surligné pendant la lecture, sautez ±10 secondes, et passez en vitesse 1,5x ou 2x.
• Marquage honnête des hallucinations — quand Whisper invente du texte sur du silence ou de la musique, les segments suspects sont clairement signalés afin que vous puissiez les vérifier ou les supprimer. Nous ne retirons jamais de texte en silence.
• Fichiers longs — traitement par blocs pour réunions, cours, conférences et épisodes entiers.
• Gestion des modèles — les modèles Whisper et Parakeet téléchargés vivent dans Documents, visibles dans l'app Fichiers. Supprimez un modèle depuis Réglages ou Fichiers pour libérer de l'espace à tout moment.
• Stockage intelligent — enregistrez les transcriptions avec des titres personnalisés, cherchez par titre ou contenu.
• Journal d'activité pour la transparence à chaque étape.
POUR QUI
• Étudiants qui prennent des notes à partir de longs cours, vidéos ou enregistrements d'écran.
• Professionnels qui transcrivent entretiens, réunions ou longs fichiers audio.
• Utilisateurs WhatsApp qui veulent lire les messages vocaux plutôt que les écouter.
• Créateurs de contenu qui transforment audio ou vidéo en texte ou sous-titres pour TikTok, Reels, Shorts ou articles de blog.
• Podcasteurs qui rendent leurs épisodes accessibles avec des sous-titres .srt.
• Toute personne sourde ou malentendante qui a besoin d'une transcription fiable et privée.
POURQUOI CHOISIR TOM
La plupart des apps de transcription envoient votre audio sur un serveur. Tom fait l'inverse : chaque moteur — Apple Speech, Whisper, Parakeet — tourne entièrement sur votre iPhone. Pas de compte, pas d'envoi, pas d'abonnement. Avec plusieurs moteurs, re-transcription et comparaison, édition des segments, export de sous-titres et un marquage des hallucinations qui ne ment pas, Tom couvre tout le flux de « j'ai dit ceci » à « voici un texte propre à partager » — sans jamais envoyer un octet hors de votre appareil.
Quoi de neuf dans la dernière version ?
Choix du moteur — Tom embarque désormais trois moteurs de transcription, tous sur l'appareil. Choisissez celui qui convient au fichier :
• Apple Speech — rapide, intégré à iOS, excellent par défaut.
• Whisper — six tailles (Tiny, Base, Small, Medium, Turbo, Large v3) jusqu'à 99 langues.
• Parakeet v3 — transcription européenne haute précision via FluidAudio.
Re-transcrire avec un autre moteur — pas satisfait du résultat ? Relancez le même audio via un autre moteur en un tap. La transcription précédente est conservée dans un historique par fichier, vous pouvez comparer et revenir en arrière à tout moment.
Réglages, redessinés — sections Système / Avancé, filtre de langue qui grise les moteurs incompatibles avec votre locale, bouton de téléchargement intégré avec progression réelle et messages d'erreur clairs.
Marquage honnête des hallucinations — quand Whisper invente du texte sur du silence ou de la musique, les segments suspects sont désormais clairement signalés dans la vue détail. Nous signalons, nous ne retirons jamais en silence.
Gestion des modèles depuis Fichiers — les modèles Whisper et Parakeet téléchargés vivent dans le dossier Documents. Parcourez, vérifiez et supprimez-les directement depuis l'app Fichiers, ou utilisez la nouvelle liste « Modèles téléchargés » dans Réglages.
Téléchargements Wi-Fi uniquement — interrupteur optionnel (activé par défaut) pour que les gros téléchargements ne passent jamais en cellulaire.
Qualité et fiabilité — téléchargement Whisper robuste avec vérifications d'espace disque, repli ANE→GPU automatique sur les appareils plus anciens, nettoyage des tokens spéciaux, indicateur de phase « Chargement du modèle… » distinct, et un bouton Annuler qui arrête vraiment en cours d'exécution.
Nécessite iOS 17. Conçu pour iPhone et iPad.