Le taux d’échantillonnage audio peut être source de contrariété pour les professionnels de la localisation de voix-off. Pourquoi ? Parce que se tromper peut signifier des fichiers de doublage vidéo qui ne se synchronisent pas correctement, ou un système IVR qui ne fonctionne pas du tout. Heureusement, il n’est pas très difficile de faire les choses correctement, si vous savez ce que vous faites.
Ce billet explique ce qu’est le taux d’échantillonnage audio et ce que les professionnels de la traduction audio doivent faire pour le respecter dans le cadre de projets audio et de doublage.

Qu’est-ce que le taux d’échantillonnage audio exactement ?

Pour enregistrer de l’audio, les systèmes numériques prennent des mesures des ondes sonores à certains intervalles – c’est-à-dire qu’ils le font un certain nombre de fois par seconde. Chacune de ces mesures discrètes est un échantillon – par conséquent, le taux d’échantillonnage audio est le nombre de ces mesures prises par seconde d’audio enregistrée. En général, plus il y a d’échantillons pris par seconde, plus la qualité de l’audio est élevée, tout simplement parce que le plus grand nombre de mesures donne à l’audio une plus grande précision.
La fréquence d’échantillonnage est représentée en Hz. Une fréquence d’échantillonnage standard est de 44 100 Hz – c’est-à-dire que l’audio est enregistré à 44 100 échantillons par seconde. Ce chiffre peut également être représenté par 44,1 kHz, ou 44,1 milliers de Hz. Cette fréquence a été adoptée pour les CD et a également été reprise pour les premiers MP3. C’est pourquoi elle est toujours utilisée pour la plupart des enregistrements de voix-off. Cependant, il existe plusieurs fréquences d’échantillonnage utilisées aujourd’hui. L’audio pour la vidéo (y compris le doublage de la voix off) utilise une fréquence d’échantillonnage de 48 000 Hz (ou 48 kHz), qui a été adoptée très tôt parce que l’audio à cette fréquence peut être synchronisé avec les films et les vidéos aux États-Unis et en Europe. De même, l’audio utilisé dans les annuaires téléphoniques est souvent enregistré à 8 kHz car il fonctionne avec les fréquences utilisées dans les lignes téléphoniques.
La capture d’écran suivante représente une onde sonore provenant d’un enregistrement à 8 kHz – chaque point sur l’onde représente un échantillon audio distinct. Notez que cette onde sonore ne représente qu’environ 0,005 seconde du fichier audio complet de la voix-off.

Pourquoi cela affecte-t-il la localisation et le doublage de la voix-off ?

Pour une raison importante : parce que différentes applications et différents lecteurs exigent que l’audio soit enregistré à une fréquence d’échantillonnage spécifique. Les vidéos sont l’exemple le plus courant. Comme la plupart des systèmes de montage vidéo exigent que l’audio soit enregistré à 48 kHz, ils n’interagissent pas bien avec l’audio enregistré à toute autre fréquence d’échantillonnage – de sérieux problèmes de synchronisation commencent à apparaître en post-production, en fait.
Il en va de même pour de nombreux systèmes e-Learning et LMS, lecteurs multimédias, systèmes téléphoniques, systèmes d’annonces de service public – et à peu près toute autre plate-forme de diffusion audio et vidéo. La plupart d’entre elles ont des exigences spécifiques en matière de fréquence d’échantillonnage.

Alors – que devez-vous savoir pour la localisation de la voix-off ?

Il y a quatre choses que les professionnels de la localisation audio et vidéo doivent garder à l’esprit.

1. La correspondance de la fréquence d’échantillonnage est essentielle à la réussite du projet.
Si vous n’avez pas les bonnes spécifications, votre audio final ne s’intégrera pas correctement. Si vous livrez de l’audio à 44,1 kHz pour un projet de localisation vidéo, votre client ne sera presque certainement pas en mesure de l’utiliser. Oui, l’audio peut être converti d’une fréquence d’échantillonnage à une autre, mais ce processus est délicat et prend du temps, surtout lorsqu’il s’agit de passer de 44,1 kHz à 48 kHz. Cela peut également signifier une perte de qualité audio – ce qui vous oblige à réenregistrer.
2. La fréquence d’échantillonnage n’affecte pas vraiment les coûts d’enregistrement…
Le coût d’enregistrement est le même pour la plupart des fréquences d’échantillonnage. Cette information n’est donc pas nécessaire pour obtenir un devis. Par exemple, si vous obtenez un devis pour un projet de doublage d’animation et que vous découvrez ensuite que vous devez livrer l’audio en 44,1 kHz, cela n’affectera pas le prix du projet.
3. …Mais vous devez avoir les bonnes spécifications pour commencer à enregistrer.
Non seulement les conversions sont difficiles, mais certains projets exigent également d’enregistrer avec une fréquence d’échantillonnage plus élevée. Par exemple, certains clients exigent une fréquence d’échantillonnage de 96 kHz pour une qualité audio source supérieure, puis une conversion en 48 kHz pour l’audio à livrer. Si vous avez enregistré à 48 kHz, vous ne serez pas en mesure de livrer l’audio à 96 kHz demandé par votre client sans de sérieux problèmes de qualité.
4. Certains projets ont des taux d’échantillonnage inhabituels.
Certains logiciels d’animation préfèrent l’audio en 44,1 kHz – par exemple, de nombreux projets audio enregistrant pour la sortie d’Adobe Flash rencontrent ce problème. De même, de nombreuses plates-formes e-Learning traditionnelles utilisent de l’audio en 22 kHz, en partie parce que cela nécessite moins de stockage et de bande passante. Et de nombreuses applications ont des lecteurs sous licence qui nécessitent une fréquence d’échantillonnage totalement différente. Attendez-vous à voir toute la gamme des fréquences d’échantillonnage, mais n’en ayez pas peur – souvenez-vous qu’un studio professionnel comme LenseUp sera en mesure de toutes les prendre en charge.
Obtenez autant d’informations que possible auprès des clients – et soumettez-leur les spécifications exactes.

Heureusement, la plupart des clients de localisation multimédia ont des spécifications concernant le taux d’échantillonnage de l’enregistrement audio dont ils ont besoin pour leurs livrables. Pour les clients qui n’en ont pas, vous pouvez généralement faire correspondre le taux d’échantillonnage de leur source audio – c’est un service que nous effectuons chez LenseUp.

Enfin, il est toujours bon de soumettre le taux d’échantillonnage audio – ainsi qu’une série complète de spécifications d’enregistrement – à votre client avant le début de la production, afin de s’assurer qu’il n’y aura pas de problèmes lors de la livraison ou de la mise en œuvre. Oui, cela nécessite d’obtenir des informations dès le départ de la part d’un client qui n’en sait peut-être pas beaucoup sur ses fichiers audio ou vidéo, et éventuellement de retarder la production – mais cette étape est essentielle pour garantir que vos projets soient livrés à temps, dans le respect du budget et avec la meilleure qualité possible.