claude-code

Claude Code en mode vocal : comment ça fonctionne et quand l'utiliser

Claude Code dispose désormais d'une entrée vocale native via /voice. Voici comment fonctionne le mode push-to-talk, quelles langues sont prises en charge, et dans quels cas parler est plus efficace que taper.

root

21 mars 2026 — 6 min read

Également disponible en English, Deutsch, Español, Nederlands.

Claude Code intègre désormais la saisie vocale native. Pas d'outils tiers, pas d'extensions navigateur — juste /voice, la barre espace et votre microphone. Anthropic a lancé le déploiement le 3 mars 2026, initialement disponible pour environ 5 % des utilisateurs, avec une expansion progressive depuis. Si votre compte y a accès, vous verrez une notification sur l'écran d'accueil de Claude Code.

Ce que le mode vocal est (et n'est pas)

Le mode vocal est de la reconnaissance vocale (speech-to-text). Claude ne répond pas à l'oral. Il n'y a pas de sortie audio, pas d'échange conversationnel. Vous parlez, la transcription apparaît dans votre champ de saisie, et Claude la traite comme n'importe quel autre prompt texte. La sortie du terminal reste identique.

Le changement concerne uniquement le côté saisie. Vous maintenez une touche, parlez naturellement, relâchez, et vérifiez la transcription avant d'envoyer. Vous pouvez combiner voix et clavier dans le même message — collez un chemin de fichier avec vos doigts tout en décrivant le contexte à voix haute.

Anthropic ne transforme pas le terminal en assistant vocal. Ils suppriment la friction entre la réflexion et la saisie. Ce sont des objectifs fondamentalement différents.

Comment l'activer

Le mode vocal nécessite Claude Code v2.1.69 ou ultérieur. Mettez d'abord à jour :

npm update -g @anthropic-ai/claude-code
claude --version

Ensuite, dans n'importe quelle session Claude Code :

/voice

Claude Code demandera l'accès au microphone à votre OS. Accordez-le.

Le mode vocal fonctionne uniquement lorsque vous vous authentifiez via un compte Claude.ai. Il n'est pas disponible avec une clé API Anthropic directe, ni via Amazon Bedrock, Google Vertex AI ou Microsoft Foundry. Si vous utilisez l'une de ces intégrations, /voice renvoie une erreur.

Push-to-talk

Le modèle d'interaction est le push-to-talk :

Maintenez la barre espace — l'enregistrement démarre, un indicateur apparaît dans votre terminal
Prononcez votre prompt naturellement
Relâchez — la transcription apparaît dans votre champ de saisie
Vérifiez et envoyez, ou tapez du contexte supplémentaire, ou annulez et réenregistrez

Il n'y a pas de microphone actif en permanence. Claude Code n'écoute pas vos conversations, vos collègues ni votre environnement sonore. Vous contrôlez exactement le moment de l'enregistrement.

La touche push-to-talk est Espace par défaut, mais elle est configurable via ~/.claude/keybindings.json :

{
  "bindings": [
    {
      "context": "Chat",
      "bindings": {
        "meta+k": "voice:pushToTalk",
        "space": null
      }
    }
  ]
}

Définir "space": null supprime le raccourci par défaut. Si vous voulez les deux touches actives, omettez cette ligne. Anthropic recommande des combinaisons avec modificateur comme meta+k — elles s'activent dès la première pression de touche plutôt que de nécessiter un maintien bref pour la détection.

Évitez d'associer une simple lettre comme v. Les lettres seules se déclenchent pendant le temps de détection du maintien et s'insèrent dans votre buffer de saisie. Restez sur Espace ou des combinaisons avec modificateur.

Vingt langues en mars 2026

Le mode vocal a été lancé avec 10 langues et a doublé en mars 2026 :

Depuis le lancement : anglais, espagnol, français, allemand, italien, portugais, japonais, coréen, chinois, hindi

Ajoutées en mars 2026 : russe, polonais, turc, néerlandais, ukrainien, grec, tchèque, danois, suédois, norvégien

La transcription est optimisée pour la terminologie technique — noms de dépôts, noms de bibliothèques, vocabulaire courant des développeurs. La reconnaissance vocale générique bute sur useState, tRPC, drizzle-orm ou kubectl. Un modèle ajusté pour le langage des développeurs gère mieux ces termes, bien que la précision varie encore selon le terme et l'accent.

Quand la voix aide réellement

Le mode vocal n'est pas universellement meilleur que la saisie au clavier. Il est meilleur dans des situations spécifiques.

Parlez quand vous :

Posez un contexte de haut niveau. « Je veux refactoriser le module auth pour utiliser JWT au lieu des sessions — commençons par comprendre ce qui est en place actuellement. » Ce type de cadrage est épuisant à taper et facile à dire.
Décrivez des bugs. Racontez ce que vous avez observé, ce que vous attendiez, ce que l'erreur affiche. Les développeurs font des raccourcis quand ils tapent des descriptions de bugs. Les énoncer à l'oral tend à être plus complet.
Réfléchissez à l'architecture. Compromis, structure, approche. La saisie orale est plus proche de la façon dont les développeurs raisonnent réellement sur les problèmes de conception.
Explorez. Quand vous n'êtes pas encore sûr de ce que vous voulez et avez besoin de formuler le problème à voix haute avant de vous engager sur une instruction précise.
Gérez l'ergonomie. Les développeurs confrontés aux TMS, à la fatigue ou à des contraintes physiques trouvent un soulagement réel ici. Des heures de travail en terminal sans solliciter le clavier, ce n'est pas anodin.

Tapez quand vous :

Écrivez des chaînes techniques précises. Noms de fichiers exacts, noms de fonctions, valeurs de configuration. Les erreurs de transcription sur des chaînes précises envoient Claude dans la mauvaise direction.
Collez du code. Dicter du code est presque toujours moins précis que le coller.
Êtes dans un environnement bruyant. Le push-to-talk aide, mais le bruit ambiant s'infiltre quand même.
Envoyez des commandes courtes. Taper /test ou /clear est plus rapide que de passer en mode vocal.

Le workflow le plus efficace combine les deux. Parlez pour le contexte et l'intention, tapez ou collez les détails précis.

Ce qui se passe sous le capot

Le pipeline vocal fonctionne en trois étapes :

Capture audio. Lorsque vous maintenez la touche push-to-talk, le terminal capture l'audio depuis votre microphone système par défaut à 16 kHz mono. Un indicateur d'enregistrement apparaît.

Transcription. Un modèle de reconnaissance vocale spécialisé pour le vocabulaire des développeurs traite l'audio. La transcription apparaît dans votre terminal pour vérification — vous la voyez avant que Claude n'agisse dessus.

Soumission du prompt. Une fois satisfait, la transcription est soumise comme un prompt texte standard. Tout ce qui suit se comporte de manière identique à une saisie au clavier — accès aux fichiers, utilisation d'outils, opérations git, workflows multi-agents, tout.

Claude Code gère les permissions du microphone au niveau de l'OS. Sur macOS, accordez à votre application terminal (Terminal, iTerm2, Warp, etc.) l'accès au microphone dans les Réglages Système. Sur Linux, votre terminal a besoin d'un accès via PulseAudio ou PipeWire. Le mode vocal ne s'activera pas sans les permissions nécessaires.

Le mode vocal ne fonctionne pas dans les sessions SSH ni dans Claude Code sur le web. Il nécessite un accès local au microphone.

Forfaits et disponibilité

Le mode vocal est inclus sans coût supplémentaire dans les forfaits Pro, Max, Team et Enterprise. Depuis mi-mars 2026, l'accès s'étend via un déploiement progressif. Il n'y a pas de formulaire d'inscription ni de liste d'attente — quand votre compte est activé, l'écran d'accueil vous le signale.

Pourquoi le terminal compte

La fonctionnalité vocale de GitHub Copilot vit dans VS Code. Cursor et Windsurf ont un support vocal partiel lié à leurs éditeurs. Le mode vocal de Claude Code fonctionne au niveau du terminal, indépendamment de tout éditeur ou IDE. La saisie vocale est donc disponible partout où Claude Code s'exécute, quel que soit le workflow que vous avez construit autour.

Quelques chiffres de début 2026 pour le contexte : Claude Code génère 2,5 milliards de dollars de revenus annualisés, avec des utilisateurs actifs hebdomadaires qui ont doublé depuis janvier. Selon SemiAnalysis, Claude Code est désormais l'auteur d'environ 4 % de tous les commits publics sur GitHub — un chiffre qui devrait atteindre 20 % d'ici fin 2026.

Les développeurs qui tireront le plus parti du mode vocal sont ceux qui le traitent comme une méthode de saisie parmi d'autres. Utilisez-le quand parler est plus rapide, revenez au clavier quand la précision compte. La friction qui disparaît est la couche de traduction entre la pensée et la saisie. Ce goulot d'étranglement compte plus que la plupart des gens ne l'imaginent, jusqu'à ce qu'ils l'aient utilisé pendant une semaine.

Pour commencer

# Mettre à jour Claude Code
npm update -g @anthropic-ai/claude-code

# Démarrer une session et activer la voix
claude
/voice

Maintenez Espace. Parlez. Relâchez. Vérifiez la transcription. Envoyez.

Pour la personnalisation des raccourcis clavier et une référence complète des paramètres, consultez la documentation officielle sur code.claude.com/docs/en/voice-dictation.

Si /voice n'est pas encore reconnu, votre compte est toujours dans la file d'attente. Continuez à mettre à jour vers la dernière version.

Si vous cherchez une expérience de dictée plus fluide en dehors du terminal — rédaction de docs, écriture d'e-mails ou prise de notes à la voix — Wispr Flow vaut le coup d'œil. C'est un outil de voice-to-text système à environ 12 $/mois, avec un mois gratuit de Pro via ce lien.

Vous pouvez coller l'URL de cet article dans Claude Code ou tout assistant IA pour obtenir du contexte si vous rencontrez des problèmes lors de la configuration du mode vocal.

Où exécuter tout ça

Cet article est rendu possible par Hetzner, dont les serveurs dédiés root nous fournissent le métal brut sur lequel nous exécutons réellement ces benchmarks, et par Tailscale, qui chiffre notre trafic nœud-à-nœud sans nous obliger à y réfléchir. Si vous trouvez cela utile, jetez-y un œil.

Vous avez besoin d'une machine avec un microphone local, ce qui exclut la plupart des VPS distants pour le mode vocal spécifiquement — mais Claude Code lui-même tourne partout. Hetzner vous propose un CX23 à 4,85 €/mois avec 10 € de crédit offert, et c'est là que nous hébergeons ce blog. Pour les machines de développement, c'est difficile à battre.

Si vous préférez éviter de gérer Claude Code vous-même, xCloud propose de l'hébergement managé OpenClaw — pointez, déployez, c'est fait.

(Liens affiliés — nous percevons une petite commission si vous vous inscrivez, sans coût supplémentaire pour vous.)