La start-up néerlandaise Whispp a profité du CES 2025 pour présenter les nouvelles fonctionnalités de son application éponyme, conçue pour aider les personnes dont la voix a été endommagée (cancer de la gorge, atteinte des cordes vocales, dysphonie, paralysie laryngée…) à mieux communiquer à l’oral.
Elle convertit une voix rauque, cassée ou même un chuchotement en une voix plus naturelle grâce à des techniques d’intelligence artificielle. Cet attachement au naturel est son avantage par rapport aux solutions concurrentes. « Elle préserve la façon dont je parle, il ne s’agit pas simplement de faire du speech-to-text puis du text-to-speech, car vous perdez énormément d’informations de cette manière », commente Akash Raj Komarlu, CTO et cofondateur de Whispp.
Latence ultra faible et pas besoin du cloud
Latence ultra faible et pas besoin du cloud
La grande nouveauté cette année (Whispp avait déjà gagné un Innovation Award au CES l’année dernière), c’est que les modèles tournent avec une latence très faible, comprise entre 60 et 170 millisecondes, et tournent en local sur le smartphone. « Notre ambition est de descendre à 50 ms »avance le CTO.
L’application est disponible sur iOS et Android, avec un modèle par abonnement. Chaque nouvel utilisateur dispose de 30 minutes d’appel gratuites, puis paie 19,99 euros par mois pour 120 minutes. La technologie fonctionne peu importe le langage et est déjà disponible en France.
L’ambition d’être installé par défaut sur les smartphones
L’ambition d’être installé par défaut sur les smartphones
« Notre modèle économique actuel est B2C, mais l’abonnement est remboursé par le gouvernement aux Pays-Bas. Nous sommes également en discussions avec des opérateurs téléphoniques aux Etats-Unis et au Japon pour son intégration dans leurs services. A terme, nous voulons vendre notre technologie sous licence aux fabricants de smartphones pour qu’elle puisse être intégrée directement dans les appareils »explique Joris Castermans, cofondateur et CEO de Whispp.
A noter que Whispp peut être utile même aux personnes ayant complètement perdu leur voix. Une fonctionnalité de message audio est disponible qui convertit du texte en voix et peut même être entraînée sur des enregistrements de l’ancienne voix de l’utilisateur pour sonner comme lui. « Notre technologie est aussi utile pour ceux souhaitant passer des appels discrètement, et est même compatible avec les systèmes fonctionnant par conduction osseuse pour rendre la voix plus naturelle »précise Joris Castermans.