CapzAi
Workflows IA2026-05-1620 min

Le workflow de sous-titres .ass pour les monteurs pros

Pourquoi exporter des fichiers Advanced SubStation Alpha est préférable aux fichiers MP4 incrustés ou aux simples SRT pour la post-production professionnelle.

Par CapzAi Team
Montage vidéoPost-ProductionFormats de sous-titresDaVinci ResolvePremiere ProLivraison agence
Le workflow de sous-titres .ass pour les monteurs pros

Les monteurs vidéo professionnels détestent les sous-titres incrustés. Nous passons des heures à étalonner une interview dans DaVinci Resolve ou à mixer des pistes audio complexes. Recevoir une vidéo finalisée d'un client avec des textes jaune fluo brûlés de façon permanente dans les pixels nous coince complètement.

Nous ne pouvons pas corriger une petite faute de frappe. Nous ne pouvons pas ajuster la taille de la police pour laisser la place à un bandeau corporate. Nous perdons le contrôle total sur le livrable.

Le format .srt basique offre une alternative textuelle. Il contient les horodatages des lignes et des blocs de texte simples. Vous importez un .srt dans votre logiciel de montage et vous obtenez un texte blanc basique, posé de manière statique en bas de l'écran.

Toutes les animations dynamiques par mot que vous voyez sur les plateformes modernes disparaissent.

Il nous reste donc les fichiers Advanced SubStation Alpha. L'extension .ass fait parfois sourire les assistants monteurs. Les vétérans savent pourtant qu'elle représente un contrôle technique absolu. Ce format conserve les chaînes de texte exactes et un timing spécifique pour chaque syllabe.

Il garde en mémoire les polices, les couleurs hexadécimales, les données de positionnement précises et la profondeur de l'ombre portée. Nous avons conçu CapzAi pour générer ces fichiers automatiquement. Vous payez vos 20 crédits par minute à l'export.

Vous obtenez le fichier MP4 incrusté avec le fichier .ass brut. Ce workflow spécifique vous offre la satisfaction immédiate d'une vidéo prête à être publiée sur les réseaux sociaux, couplée au contrôle absolu d'un fichier de projet éditable. Je veux détailler comment utiliser ces fichiers dans un environnement de post-production haut de gamme.

La mécanique de l'Advanced SubStation Alpha

Analyser la structure du fichier

La plupart des monteurs n'ouvrent jamais un fichier de sous-titres dans un éditeur de texte. Vous devriez le faire. Faites un clic droit sur un fichier .ass de votre disque dur et sélectionnez "Ouvrir avec le Bloc-notes" sous Windows ou "TextEdit" sous macOS.

Vous verrez trois blocs distincts de structure de données. Le premier bloc s'intitule [Script Info]. Il définit les règles mathématiques de l'ensemble du document en précisant les paramètres de résolution vidéo d'origine.

Si vous avez utilisé CapzAi pour le découpage automatique de vidéos longues destiné aux plateformes verticales, les infos du script indiquent explicitement PlayResX: 1080 et PlayResY: 1920. Vos coordonnées de texte correspondent ainsi parfaitement à votre cadre vidéo, peu importe le lecteur multimédia utilisé.

Modifier les styles globaux

Le deuxième bloc est [V4+ Styles]. Il agit comme une feuille de style CSS pour votre projet vidéo. Chaque preset CapzAi génère ici une ligne de style très spécifique.

Si vous choisissez notre preset viral pop, CapzAi écrit une ligne de style définissant une police sans-serif épaisse, un contour noir marqué, une distance d'ombre portée précise et une couleur active jaune vif. Le code spécifie les valeurs hexadécimales exactes, le padding vertical, les marges horizontales, l'espacement des lignes et l'épaisseur du trait.

Vous pouvez modifier la police de base de Montserrat à Inter Bold en 64pt directement dans ce document texte. Vous évitez ainsi d'ouvrir votre lourd logiciel de montage pour effectuer des changements de typographie globaux sur une vidéo de cinquante minutes.

Contrôler le timing par mot

Le troisième bloc contient les [Events]. Il s'agit des données de suivi de la timeline, où chaque ligne de dialogue isolée possède sa propre ligne dédiée.

Dans un format standard, une ligne ressemble à 00:01:23,400 --> 00:01:25,100. Elle indique simplement au lecteur quand afficher la phrase entière. L'Advanced SubStation Alpha va beaucoup plus loin en utilisant des balises de remplacement entre accolades.

Lorsque CapzAi génère des données de timing par mot, il insère des balises {\k} avant chaque mot isolé. La lettre "k" signifie karaoké, et le chiffre qui la suit représente des centisecondes. La chaîne {\k40}Bonjour signifie que le mot "Bonjour" reste en surbrillance à l'écran pendant exactement 400 millisecondes.

Les monteurs pros obtiennent ainsi un contrôle granulaire sur le rythme visuel. Si un intervenant bafouille ou étire une syllabe pour un effet dramatique, le fichier représente mathématiquement ce délai précis.

Si vous n'êtes pas d'accord avec le timing automatique de notre serveur sur une punchline visuelle, vous remplacez le nombre 40 par 80 et vous enregistrez. L'animation se met à jour instantanément.

L'architecture d'export de CapzAi

Rendu des presets de texte

Lorsque vous finalisez une timeline vidéo dans votre tableau de bord de projets, le moteur de rendu de CapzAi prend le relais. Nous séparons volontairement l'analyse audio des phonèmes du rendu visuel du texte.

Nos modèles de speech-to-text cartographient d'abord les formes d'onde audio. Ensuite, le moteur de mise en page applique l'un de nos presets de sous-titres viraux. Nous proposons des layouts karaoké, classique, docu et créatifs.

Chaque preset génère une structure de fichier .ass unique. Le preset classique ressemble aux sous-titres traditionnels de la télévision. Il utilise une boîte de fond noire semi-transparente avec un texte blanc simple.

Le preset viral pop nécessite des animations de mise à l'échelle mathématiques intenses. Le texte apparaît à l'écran de manière dynamique tandis que le mot actif change de couleur. Les mots précédents rétrécissent légèrement pour maintenir la concentration visuelle sur la syllabe en cours.

Gérer les balises de transformation

Pour obtenir cet effet mécaniquement, le moteur CapzAi écrit des balises de transformation complexes directement dans le bloc d'événements. Il utilise {\t} pour les courbes d'animation temporelles.

Il utilise aussi {\fscx} et {\fscy} pour contrôler les pourcentages d'échelle horizontale et verticale sur des durées en millisecondes. L'apparition d'un seul mot à l'écran peut exiger trente caractères de code de formatage. Nous gérons toute cette trigonométrie complexe sur nos serveurs.

Le workflow de double livraison

Vous payez votre tarif fixe à l'export. Pour ce prix, le serveur vous remet une archive zip compressée.

Dans cette archive, vous trouvez votre vidéo MP4 finalisée et le fichier maître .ass. Ce système de double livraison résout un énorme goulot d'étranglement en post-production.

Vous pouvez uploader immédiatement le MP4 incrusté sur vos réseaux sociaux. Si votre directeur de création vous écrit cinq minutes plus tard pour changer la couleur de la marque du jaune au vert fluo, vous n'avez pas à refaire le rendu du lourd fichier vidéo.

Vous ouvrez le fichier .ass, vous lancez une commande chercher-remplacer basique sur le code hexadécimal, et vous enregistrez le fichier texte. L'opération prend trente secondes.

Rythme multilingue et directionnalité du texte

Synchroniser l'audio traduit

L'application de la fonction de dubbing vocal IA de CapzAi introduit une grande complexité de timing dans votre workflow. L'anglais est une langue parlée rapide et dense. Le français demande environ vingt pour cent de syllabes supplémentaires pour exprimer le même concept.

L'arabe présente des structures de rythme complètement différentes selon le dialecte régional parlé.

Si vous prenez un vlog anglais d'une minute et que vous le doublez en français avec nos outils IA, la piste audio s'allonge. Une phrase qui dure exactement quatre secondes en anglais peut prendre cinq secondes et demie en français.

Utiliser un fichier .srt standard généré à partir de la vidéo anglaise originale vous obligerait à décaler manuellement chaque bloc de sous-titres pour l'adapter au nouveau timing audio français.

CapzAi gère cet étirement temporel automatiquement. Lorsque vous demandez un dub français, notre moteur recalcule la cartographie des phonèmes sur le nouvel audio synthétique. Il génère un tout nouveau fichier .ass synchronisé directement sur la voix IA pour que le surlignage karaoké corresponde parfaitement aux syllabes françaises.

Cela offre un avantage logistique majeur pour la distribution de contenu à l'international. Vous uploadez une vidéo principale en anglais et vous cliquez sur quelques boutons de configuration.

Vous recevez des fichiers vidéo et des fichiers texte distincts pour l'anglais, le français, l'arabe et le darija. Chaque fichier de sous-titres contient des balises de timing mathématiquement précises, mappées sur sa piste audio locale respective.

Vous glissez l'audio français, la vidéo brute et le fichier .ass français sur une nouvelle timeline. Tout se synchronise sans le moindre effort.

Vous évitez de passer quatre heures à déplacer des blocs de texte pour les caler sur les formes d'onde traduites. Vous pouvez en lire plus sur l'automatisation de votre workflow de localisation sur notre blog d'ingénierie.

Le formatage de droite à gauche

Les langues s'écrivant de droite à gauche font planter presque tous les éditeurs de sous-titres basiques du marché. Si vous collez une chaîne de texte en arabe dans un outil de sous-titrage web bon marché, les signes de ponctuation se retrouvent du mauvais côté de la phrase.

Les lettres se détachent les unes des autres. L'ordre logique des mots s'inverse de manière imprévisible lors des retours à la ligne.

Le format .ass gère la directionnalité mathématique explicite du texte. CapzAi encode correctement les chaînes de mise en page RTL nécessaires pour l'arabe et le darija.

Nous configurons les bonnes balises d'alignement de grille, où {\an} contrôle le positionnement spatial. {\an1} se place dans le coin inférieur gauche tandis que {\an3} se trouve dans le coin inférieur droit. {\an2} s'assoit précisément au centre en bas.

Pour les langues RTL, nous ajustons dynamiquement ces ancrages de coordonnées. Le texte s'écoule naturellement de la droite de l'écran vers la gauche.

Prérequis des moteurs logiciels

Vous devez vous assurer que votre logiciel de montage local supporte les moteurs de rendu de texte complexes. Premiere Pro vous oblige à activer explicitement le moteur de texte pour le Moyen-Orient dans vos préférences d'application.

Si vous ignorez cette étape obligatoire, Premiere va mélanger le fichier .ass arabe lors de l'importation. Resolve gère le texte RTL nativement sans nécessiter de modification des préférences.

Lorsque vous utilisez notre preset docu pour du texte arabe, l'effet cinématique de machine à écrire s'anime correctement de droite à gauche. Le code sous-jacent anime le masque rectangulaire {\clip} à l'envers.

Vous obtenez une apparition de texte parfaite qui respecte le sens de lecture natif de votre audience cible. Vous n'avez jamais à inverser manuellement des chaînes de caractères ou à lutter contre des problèmes de jonction de lettres.

Le pipeline DaVinci Resolve

Importer la piste de sous-titres

DaVinci Resolve gère les fichiers .ass mieux que n'importe quel autre logiciel de montage sur le marché. Blackmagic Design a intégré une vraie prise en charge native du format à partir de la version 18.

Vous terminez d'abord votre montage principal. Vous étalonnez vos rushes et vous mixez votre audio. Vous finalisez vos incrustations graphiques et vous verrouillez votre image.

Une fois l'image verrouillée, allez dans la Bibliothèque de médias et sélectionnez l'option d'importation de sous-titres pour amener le fichier .ass fourni par CapzAi. Resolve crée instantanément une piste de sous-titres dédiée sur votre timeline active.

Vous déposez le fichier sur la nouvelle piste. Resolve lit tout de suite les données du bloc [V4+ Styles] pour appliquer les bonnes polices, les couleurs spécifiques et les marges numériques. Le timing karaoké par mot fonctionne à la perfection.

Corriger les erreurs d'échelle des coordonnées

Resolve ignore parfois certaines données de coordonnées spatiales si les paramètres de votre projet entrent en conflit direct avec les balises de résolution internes du fichier de sous-titres. Si vous remarquez que vos textes CapzAi sont placés trop bas sur l'écran, vérifiez la résolution de votre timeline principale.

Une timeline verticale 1080x1920 nécessite une correspondance mathématique exacte dans les balises PlayRes du fichier texte. Si ces deux nombres diffèrent, Resolve met le bloc de texte à l'échelle de façon imprévisible.

Vous corrigez cette erreur d'échelle directement dans la fenêtre de l'inspecteur de Resolve. Cliquez sur l'élément de la piste de sous-titres, allez dans l'onglet Style de piste, et modifiez manuellement les données de position importées en ajustant le curseur de l'axe Y vertical.

Animations complexes basées sur les nœuds

Pour un contrôle visuel extrême, les étalonneurs publicitaires convertissent la piste de sous-titres basique directement en nœuds Text+ complexes sur la page Fusion. Le fichier est ainsi divisé en compositions Fusion individuelles.

Vous perdez la simplicité de la gestion d'un document texte unique. Vous gagnez en revanche la possibilité d'appliquer des effets de particules sur des syllabes précises. Si un client veut que des flammes numériques jaillissent du mot "épicé", vous convertissez ce clip de sous-titre spécifique en un clip Fusion.

Vous ajoutez vos émetteurs de particules à l'arbre de nœuds et vous calculez le rendu.

Le pipeline Adobe Premiere Pro

Les limites des Objets graphiques essentiels

Adobe Premiere Pro entretient une relation compliquée avec les fichiers .ass. Adobe prétend officiellement supporter l'importation du format, mais la réalité implique des obstacles techniques que les monteurs pros doivent contourner.

Lorsque vous importez un fichier généré par CapzAi dans Premiere, le logiciel place l'élément dans votre chutier comme un fichier de sous-titres standard. Vous glissez cet élément sur votre timeline active pour créer une piste de sous-titres dédiée.

Il lit parfaitement les chaînes de texte brutes et les horodatages des blocs. En revanche, il ignore complètement les balises de style mathématiques avancées.

Premiere préfère forcer tous les sous-titres dans son propre écosystème du panneau Objets graphiques essentiels. Si vous utilisez beaucoup le preset viral pop de CapzAi avec ses animations de rebond, Premiere supprime ces animations lors d'un import natif. Le texte apparaît de manière totalement statique à l'écran.

La solution de la couche alpha

Les monteurs professionnels contournent cette limitation d'Adobe en utilisant des outils de conversion tiers. L'approche la plus fiable consiste à utiliser l'application gratuite Aegisub pour rendre une vidéo superposée avec une couche alpha transparente.

Vous téléchargez Aegisub depuis son dépôt open source et vous ouvrez votre fichier. Vous exportez le fichier sous forme de vidéo QuickTime ProRes 4444 contenant un fond transparent. Aegisub calcule parfaitement toutes les animations karaoké, les ombres portées intenses et les polices personnalisées.

Vous prenez cet énorme fichier vidéo transparent et vous le déposez sur la piste V2 de votre timeline Premiere. Votre métrage caméra original reste intact sur la piste V1.

Ce workflow garantit une fidélité visuelle absolue en contournant totalement le système restrictif des pistes de sous-titres de Premiere. Si vous devez corriger une faute de frappe plus tard, vous ouvrez simplement Aegisub pour modifier le mot et vous exportez à nouveau la vidéo transparente.

Vous écrasez l'ancien fichier sur votre disque dur et Premiere met automatiquement à jour le média lié sur votre timeline.

Les solutions pour Apple Final Cut Pro

La traduction en FCPXML

Apple Final Cut Pro refuse de lire nativement les fichiers .ass. L'application s'appuie presque exclusivement sur le format .srt basique ou sur sa propre intégration du standard de diffusion CEA-608. Si vous montez sur FCPX, vous devez utiliser une couche de traduction pour accéder à ces fonctionnalités avancées.

L'approche principale consiste à convertir le fichier de sous-titres au format document FCPXML. Plusieurs applications utilitaires sur le Mac App Store effectuent cette conversion en traduisant les données de style brutes en générateurs de texte individuels Final Cut Pro.

Le résultat est très précis. Votre timeline magnétique se remplit de dizaines de clips texte individuels. Vous pouvez cliquer sur n'importe quel mot isolé, ouvrir l'inspecteur FCPX et appliquer des effets natifs Apple Motion directement sur le texte.

Les rendus ProRes transparents

Si vous voulez éviter d'utiliser des utilitaires de conversion XML, utilisez la méthode de la couche alpha décrite pour Premiere Pro. Exportez un fichier ProRes 4444 transparent avec un outil dédié comme Aegisub ou Subler.

Déposez le fichier vidéo transparent directement au-dessus de votre scénario principal. Cela reste la méthode la plus rapide pour intégrer des animations de presets créatifs dans un projet FCPX. Vous évitez de passer douze heures à recréer les animations graphiques à partir de zéro dans Apple Motion.

Le Chat-to-Edit : Préformatage avec l'Agent IA

Exécution rapide des commandes

Avant de cliquer sur le bouton d'export et de dépenser vos crédits, vous devriez finaliser votre texte à l'aide de notre Agent IA intégré. L'agent se trouve directement dans votre tableau de bord et agit comme une interface de modification par chat pour vos données de sous-titres brutes.

Vous tapez une commande textuelle simple pour lui demander de supprimer tous les mots de remplissage. L'agent scanne instantanément toute la timeline et supprime chaque occurrence de "euh" et "hum". Il ajuste automatiquement les horodatages pour combler les vides temporels.

Vous tapez : "Change la couleur du mot actif en code hex #FF5500." L'agent met immédiatement à jour le bloc [V4+ Styles] en arrière-plan. Vous lui ordonnez de mettre une majuscule à chaque nom propre, et le serveur exécute la modification sur l'ensemble du script.

Éviter les ajustements manuels

Cette interface conversationnelle vous évite de devoir effectuer de fastidieuses opérations de chercher-remplacer dans un éditeur de texte. Vous laissez l'intelligence artificielle s'occuper des modifications massives.

Vous ne touchez au fichier .ass brut dans votre logiciel de montage que lorsque vous devez effectuer des ajustements chirurgicaux ultra-spécifiques pour un client exigeant. Consultez notre guide sur la structuration des commandes de montage avancées pour accélérer cette phase.

Un exemple concret : Corriger la minute 45

Identifier la faute

Examinons un scénario réel très précis. Vous venez de passer un podcast corporate d'une heure dans notre moteur de découpage automatique. Vous avez sélectionné un segment de cinq minutes qui parle des marchés financiers mondiaux et vous avez appliqué le preset viral pop avant d'exporter la vidéo en haute résolution.

Votre client visionne le livrable MP4. Il remarque un gros problème contextuel à 4:12 dans la vidéo. L'intervenant a clairement dit "fiscal", mais le moteur de transcription automatique a compris "physique".

Le mauvais mot reste à l'écran pendant exactement 600 millisecondes. Si vous n'aviez qu'un fichier MP4 avec texte incrusté, votre workflow serait catastrophique.

Vous devriez retourner sur l'interface web de CapzAi, modifier la chaîne de texte, et payer une nouvelle série de crédits pour relancer le rendu. Vous attendriez dix minutes que le serveur traite l'encodage vidéo complexe.

Exécuter la modification du code

Puisque vous possédez le fichier .ass, votre workflow change du tout au tout. Vous ouvrez le fichier texte dans TextEdit sur votre Mac et vous tapez CMD+F.

Vous cherchez la chaîne "physique" et vous localisez la ligne d'événement exacte dans le code. Elle ressemble à ceci :

Dialogue: 0,0:04:12.00,0:04:12.60,Default,,0,0,0,,{\k60}physique

Vous supprimez le mot "physique" et vous tapez le mot "fiscal". Vous faites CMD+S pour enregistrer le document texte.

Vous ouvrez votre logiciel de montage local et vous déposez la vidéo brute originale sur la timeline. Vous glissez le fichier .ass nouvellement modifié juste au-dessus.

Vous faites le rendu de cette section spécifique de cinq secondes pour confirmer visuellement la correction typographique. Vous exportez la vidéo finale directement depuis votre machine.

Le temps total consacré à la correction de l'erreur du client est inférieur à deux minutes. Vous n'avez utilisé aucun temps de calcul serveur tout en conservant un contrôle technique absolu sur le fichier vidéo final.

Exigences de livraison en agence

La remise des deux fichiers

Les agences de montage vidéo font face à des demandes clients uniques et changeantes. Une marque peut vouloir une vidéo agressivement formatée pour TikTok aujourd'hui. Demain, elle voudra peut-être utiliser ce même asset vidéo sur une landing page corporate plus sobre.

Les sous-titres viral pop qui génèrent un fort engagement sur les réseaux sociaux manquent de professionnalisme sur une page de vente B2B. Lorsque vous livrez des assets de production finaux à vos clients, vous devez toujours fournir deux fichiers.

Vous leur donnez le fichier .mp4 entièrement incrusté pour une diffusion immédiate sur les réseaux sociaux. Vous leur donnez aussi un fichier .mp4 propre sans aucun texte incrusté, accompagné du fichier .ass brut.

Vous expliquez explicitement la valeur financière de ce package modulaire. Vous indiquez au client qu'il peut uploader la vidéo vierge sur le portail interne de l'entreprise et attacher manuellement le fichier de sous-titres au lecteur web. La plupart des plateformes modernes d'hébergement vidéo pour entreprises lisent nativement ces fichiers et affichent le texte proprement sur la vidéo, sans altérer les pixels de la source.

Justifier les budgets premiums

Cette approche stratégique justifie des forfaits mensuels premiums. Vous livrez un contenu éphémère pour les réseaux sociaux accompagné d'un package vidéo hautement modulaire, précis mathématiquement et paré pour l'avenir.

Le modèle de tarification à l'export de CapzAi simplifie le calcul des frais d'agence. Vous connaissez exactement le coût initial de la transcription, de la traduction multilingue, du dubbing IA et du rendu final du serveur.

Vous intégrez simplement ce coût de base en crédits dans la facturation de votre agence. Vous livrez des fichiers de qualité supérieure. Lancez un test dans votre tableau de bord CapzAi dès aujourd'hui et vérifiez les structures de fichiers obtenues.

Envie de lire plus d’analyses?

Explorez tous nos articles sur les sous-titres IA, la création UGC et les workflows créateurs.