Chaque personne a besoin d’un outil pour travailler. Il se trouve qu’une personne a commencé à être qualifiée de rationnelle à partir du moment où l’outil a été utilisé pour tout type d’activité (la formulation est boiteuse, mais en général elle l’est). En fait, tout musicien, étant une personne raisonnable, devrait pouvoir posséder au moins dans une certaine mesure un instrument de musique. Cependant, dans le cadre de cet article, nous ne parlerons pas d’un instrument de musique au sens habituel (guitare, piano, triangle…), mais d’un instrument qui est en outre nécessaire au traitement d’un signal sonore. Il s’agit de l’interface audio.
Base théorique
Réservons tout de suite, l’interface son, l’interface audio, la carte son sont des synonymes contextuels dans le cadre de la présentation. En général, une carte son est un sous-ensemble de l’interface son. Du point de vue de l’analyse des systèmes, une interface est quelque chose conçu pour l’interaction de deux ou plusieurs systèmes. Dans notre cas, les systèmes peuvent ressembler à ceci:
- appareil d’enregistrement sonore (microphone) – système de traitement (ordinateur);
- système de traitement (ordinateur) – appareil de reproduction du son (haut-parleurs, écouteurs);
- hybrides 1 et 2.
Formellement, tout ce dont une personne ordinaire a besoin d’une interface audio est de supprimer des données d’un appareil d’enregistrement et de les donner à un ordinateur, ou vice versa, de prendre des données d’un ordinateur en les envoyant à un appareil de lecture. Lors du passage du signal à travers l’interface audio, une transformation spéciale du signal est effectuée afin que le côté récepteur puisse continuer à traiter ce signal. Le dispositif de lecture (final) reproduit en quelque sorte un signal analogique ou sinusoïdal, qui s’exprime sous la forme d’une onde sonore ou élastique. Un ordinateur moderne fonctionne avec des informations numériques, c’est-à-dire des informations codées sous la forme d’une séquence de zéros et de uns (plus précisément, sous la forme de signaux de bandes discrètes de niveaux analogiques). Ainsi, une obligation est imposée à l’interface audio de convertir le signal analogique en numérique et/ou inversement, qui est en fait le cœur de l’interface audio: un convertisseur numérique-analogique et analogique-numérique (DAC et ADC ou DAC et ADC, respectivement), ainsi que la liaison à la forme d’un codec matériel, toutes sortes de filtres, etc.
En règle générale, les PC, ordinateurs portables, tablettes, smartphones, etc. modernes disposent déjà d’une carte son intégrée, qui vous permet d’enregistrer et de lire des sons, s’il existe des appareils d’enregistrement et de lecture.
— Voir également: Les 10 meilleures bibliothèques de batterie pour NI Kontakt 5 pour 2017! —
C’est là que se pose l’une des questions les plus fréquemment posées:
la carte son intégrée peut-elle être utilisée pour l’enregistrement et/ou le traitement du son?
La réponse à cette question est très ambiguë.
Comment fonctionne une carte son
Voyons ce qui arrive au signal qui traverse la carte son. Essayons d’abord de comprendre comment un signal numérique est converti en analogique. Comme mentionné précédemment, un DAC est utilisé pour ce type de conversion. Nous n’entrerons pas dans la jungle du remplissage matériel, compte tenu des différentes technologies et éléments de base, nous désignerons simplement « sur nos doigts » ce qui se passe dans le «matériel».
Nous avons donc une certaine séquence numérique, qui est un signal audio à transmettre à l’appareil.
111111000011001001100101010100111111001100101000000110100001011101100110110001
00000001000110001010111110010100010010110011101111111110111001111001110010010
Ici, les couleurs sont les petits morceaux de son codés. Une seconde de son peut être codée avec un nombre différent de ces morceaux, le nombre de ces morceaux est déterminé par la fréquence d’échantillonnage, c’est-à-dire que si le taux d’échantillonnage est de 44,1 kHz, alors une seconde de son sera divisée en 44100 de ces morceaux. Le nombre de zéros et de uns dans une pièce est déterminé par la profondeur d’échantillonnage ou la quantification, ou, simplement, la profondeur de bits.
Maintenant, pour imaginer le fonctionnement du DAC, rappelons le cours de géométrie de l’école. Imaginez que le temps est l’axe des X, le niveau est Y. Sur l’axe des X nous marquons le nombre de segments qui correspondront au taux d’échantillonnage, sur l’axe des Y – 2n segments, qui indiqueront le nombre de niveaux d’échantillonnage , après quoi, progressivement, nous marquons les points qui correspondront à des niveaux sonores spécifiques.
Il convient de noter qu’en réalité, le codage selon le principe ci-dessus ressemblera à une ligne brisée (graphique orange), cependant, lors de la conversion, ce qu’on appelle. approximation à une sinusoïde, ou simplement approximation du signal à la forme d’une sinusoïde, ce qui conduira à un lissage des niveaux (graphique bleu).
— Voir également: Où est-il plus rentable de vendre votre musique? Comparez CDBaby et Tunecore —
Quelque chose comme ça ressemblera à un signal analogique, qui est obtenu à la suite d’un décodage numérique. Il est à noter que la conversion analogique-numérique s’effectue exactement à l’opposé: toutes les 1 / sample_frequence secondes, le niveau du signal est supprimé et codé en fonction de leur profondeur d’échantillonnage.
Nous avons donc compris comment fonctionnent (plus ou moins) le DAC et l’ADC. Il convient maintenant de considérer quels paramètres affectent le signal final.
Paramètres de base de la carte son
Au cours de l’examen du fonctionnement des convertisseurs, nous nous sommes familiarisés avec deux paramètres principaux, à savoir la fréquence et la profondeur d’échantillonnage, nous les examinerons plus en détail.
Le taux d’échantillonnage est, approximativement, le nombre d’intervalles de temps par lesquels 1 seconde de son est divisée. Pourquoi est-il si important pour les gens du son d’avoir une carte son capable de fonctionner à une fréquence supérieure à 40 kHz ? Cela est dû à la soi-disant. Le théorème de Kotelnikov (oui, oui, encore des mathématiques). Si c’est trivial, alors, selon ce théorème, dans des conditions idéales, un signal analogique peut être reconstruit à partir d’un signal discret (numérique) de manière arbitrairement précise si la fréquence d’échantillonnage est supérieure à 2 gammes de fréquences de ce même signal analogique… Autrement dit, si nous travaillons avec le son qu’une personne entend (~ 20 Hz – 20 kHz), alors la fréquence d’échantillonnage sera (20 000 – 20) x2 ~ 40 000 Hz, d’où la norme de facto 44,1 kHz, c’est la fréquence d’échantillonnage pour le plus précis encoder le signal plus un peu plus (ceci, bien sûr, est exagéré, puisque cette norme est fixée par Sony et les raisons sont beaucoup plus prosaïques). Cependant, comme indiqué précédemment, c’est dans des conditions idéales. Les conditions idéales signifient ce qui suit : le signal doit être infiniment long dans le temps et ne pas présenter de singularités sous la forme d’une puissance spectrale nulle ou de pics de salves de grande amplitude. Il va sans dire qu’un signal audio analogique typique n’est pas adapté aux conditions idéales, du fait que ce signal est fini dans le temps et présente des rafales et des disparitions (en gros, des intervalles de temps).
La profondeur d’échantillonnage ou le bit est le nombre de puissances de 2, qui détermine en combien d’intervalles l’amplitude du signal sera divisée. Une personne, en raison de l’imperfection de son appareil sonore, se sent généralement à l’aise dans la perception avec une profondeur de bits de signal d’au moins 10 bits, c’est-à-dire 1024 niveaux, il est peu probable qu’une personne ressente une nouvelle augmentation de la profondeur de bits , ce qui ne peut pas être dit de la technologie.
Comme vous pouvez le voir ci-dessus, lors de la conversion d’un signal, la carte son fait certaines « concessions ».
Tout cela conduit au fait que le signal résultant ne répétera pas exactement l’original.
Problèmes lors du choix d’une carte son
Ainsi, un ingénieur du son ou un musicien (choisissez le vôtre) a acheté un ordinateur avec un tout nouveau système d’exploitation, un processeur sympa, une grande quantité de RAM avec une carte son intégrée à la carte mère, qui est promue par le fabricant, a des sorties à fournir un système de son 5.1, le DAC-ADC a une fréquence d’échantillonnage de 48 kHz (ce n’est plus 44,1 kHz !), 24 bits et ainsi de suite et ainsi de suite… Pour fêter ça, l’ingénieur installe le logiciel de prise de son et découvre que cette carte son ne peut pas simultanément « tirer » du son, appliquer des effets et le lire instantanément là-bas. Le son, même s’il s’avère de très haute qualité, cependant, entre le moment où l’instrument joue la note, l’ordinateur traite le signal et le rejoue un certain temps ou, pour faire simple, il y a un décalage. C’est étrange, car le consultant de l’Eldorado a tant fait l’éloge de cet ordinateur, a parlé de la carte son et en général… et voilà… hein. Avec chagrin, l’ingénieur retourne au magasin, remet l’ordinateur acheté, verse une somme fabuleuse supplémentaire afin de remplacer celui rendu par un ordinateur avec un processeur encore plus puissant, plus de RAM, une carte son à 96 (!!! ) kHz et 24 bits et… au final la même chose.
— Voir également: Qu’est-ce que LUFS et pourquoi est-ce important? —
En fait, les ordinateurs typiques avec des cartes son intégrées standard et des pilotes de stock pour eux ne sont pas conçus à l’origine pour traiter le son et le lire en mode quasi temps réel, c’est-à-dire qu’ils ne sont pas conçus pour le traitement VST-RTAS. Il ne s’agit pas du tout ici du bourrage « de base » sous la forme d’un processeur-RAM-disque dur, chacun de ces composants est capable d’un tel mode de fonctionnement, le problème est que cette carte son, parfois, se contente ne peut pas « travailler » en temps réel…
Pendant le fonctionnement de tout appareil informatique, en raison de la différence de vitesse de fonctionnement, le soi-disant. retards. Il en résulte que le processeur attend un ensemble de données qu’il doit traiter. De plus, lors du développement du système d’exploitation et des pilotes, ainsi que du logiciel d’application, les programmeurs ont recours à ce qu’on appelle. création de ce qu’on appelle abstraction logicielle, c’est à ce moment que chaque couche supérieure du code du programme « cache » toute la complexité du niveau inférieur, ne fournissant à son niveau que les interfaces les plus simples. Parfois, il existe des dizaines de milliers de ces niveaux d’abstraction. Cette approche simplifie le processus de développement, mais augmente le temps nécessaire aux données pour voyager de la source à la destination et vice versa.
En fait, des décalages peuvent survenir non seulement avec les cartes son intégrées, mais aussi celles qui sont connectées via USB, WireFire (repose en paix à lui), PCI, etc.
Pour éviter ce type de décalage, les développeurs utilisent des solutions de contournement qui éliminent les abstractions et les transformations logicielles inutiles. L’une de ces solutions est l’ASIO préféré de tous pour OS Widows, JACK (à ne pas confondre avec un connecteur) – pour Linux, CoreAudio et AudioUnit – pour OSX. Il convient de noter qu’OSX et Linux se débrouillent très bien sans les « béquilles » comme Windows. Cependant, tous les appareils ne sont pas capables de fonctionner à la vitesse et à la précision requises.
Disons que notre ingénieur/musicien appartient à la catégorie des Kulibins et a pu mettre en place JACK/CoreAudio ou faire fonctionner sa carte son avec un driver ASIO de la société « folk craft ».
Dans le meilleur des cas, de cette façon, notre maître a réduit le décalage d’une demi-seconde à 100 ms presque acceptable. Le problème des dernières millisecondes réside dans tout le reste et dans la transmission interne du signal. Lorsque le signal passe de la source via l’interface USB ou PCI au processeur central, le signal est supervisé par le pont sud, qui s’occupe en fait du fait qu’il fonctionne avec la plupart des périphériques et est directement subordonné au processeur central. Néanmoins, le processeur central est un personnage important et occupé, il n’a donc pas toujours le temps de traiter le son en ce moment, donc notre maître devra soit accepter que ces 100 ms puissent « sauter » de ± 50 ms sinon plus. La solution à ce problème peut être l’achat d’une carte son avec son propre microcircuit pour le traitement des données ou DSP (Digital Signal Processor).
En règle générale, la plupart des cartes son « externes » (appelées cartes son de jeu) ont un coprocesseur de ce type, mais il est assez rigide à travailler et est essentiellement destiné à « améliorer » le son reproduit. Les cartes son conçues à l’origine pour le traitement du son ont un coprocesseur plus adéquat ou, dans la version Edge, un tel coprocesseur est vendu séparément. L’avantage d’utiliser un coprocesseur est le fait que s’il est utilisé, un logiciel spécial traitera le signal pratiquement sans utiliser le processeur central. L’inconvénient de cette approche peut être le prix, ainsi que l' »affûtage » de l’équipement pour travailler avec un logiciel spécial.
Séparément, je voudrais noter l’interface pour coupler une carte son et un ordinateur. Les exigences ici sont tout à fait acceptables : pour une vitesse de traitement suffisamment élevée, des interfaces telles que l’USB 2.0, le PCI suffiront. Un signal audio n’est pas vraiment une grande quantité de données comme un signal vidéo, les exigences sont donc minimes. Cependant, j’ajouterai une mouche dans la pommade : le protocole USB ne garantit pas la livraison à 100 % des informations de l’expéditeur au destinataire.
Nous avons choisi le premier problème – de longs délais lors de l’utilisation de pilotes standard ou un prix élevé pour l’utilisation d’une carte son avec une latence adéquate.
Auparavant, nous avons réalisé que ce n’est pas une tâche facile d’atteindre la transmission de signal analogique idéale. En plus de cela, il convient de mentionner le bruit et les erreurs qui surviennent lors du processus de suppression / conversion / transmission d’un signal en tant que données, car, si vous vous souvenez de la physique, tout appareil de mesure a sa propre erreur et tout algorithme a sa propre précision.
Une blague du domaine de l’ingénierie radio: dans la communication radio, il existe un soi-disant. Q-codes, désignations à trois lettres de diverses questions et réponses, utilisées pour réduire le nombre de caractères transmis. L’un des codes non officiels « QZZ » signifie « Est-ce que ce bourdonnement est à 60 Hz ou ronflez-vous? »
Cette blague est très indicative au vu du fait que le fonctionnement de la carte son est également influencé par le rayonnement des équipements voisins, jusqu’aux ultrasons émis par le processeur central lors du fonctionnement. A tout le reste, il convient d’ajouter des distorsions aux caractéristiques du signal enregistré/restitué, qui dépendent de l’appareil final (microphone, micro, haut-parleurs, casque, etc.). Souvent, pour le marketing, les fabricants de divers appareils audio augmentent délibérément la fréquence possible du signal reçu / reproduit, à partir duquel une personne qui a enseigné la biologie et la physique à l’école a une question tout à fait consciente « pourquoi, si une personne n’entend pas en dehors du gamme de 20-20 kHz? » Comme on dit, dans chaque vérité, il y a un grain de vérité. En effet, de nombreux fabricants n’indiquent que sur le papier des caractéristiques de meilleure qualité de leurs équipements. Néanmoins, si le fabricant a effectivement fabriqué un appareil capable de supprimer/reproduire un signal dans une plage de fréquences légèrement plus large, il vaut la peine de penser à acheter cet équipement au moins pendant un certain temps.
Voici la chose. Tout le monde se souvient parfaitement de la réponse en fréquence, de beaux graphiques avec des irrégularités, etc. Lorsqu’il capte un son (considérez uniquement cette option), le microphone le déforme en conséquence, ce qui se caractérise par une irrégularité de sa réponse en fréquence dans la plage qu’il « entend ».
Ainsi, ayant un microphone capable de capter un signal dans la plage standard (20-20k), nous n’obtiendrons de distorsion que dans cette plage. En règle générale, les distorsions obéissent à la distribution normale (rappelez-vous la théorie des probabilités), avec de petites entrecoupées d’erreurs aléatoires. Que se passe-t-il si, toutes choses étant égales par ailleurs, nous élargissons la portée du signal capté? Si nous suivons la logique, alors le «plafond» (graphique de la densité de probabilité) s’étirera dans le sens d’une augmentation de la plage, déplaçant ainsi les distorsions en dehors de la plage audible qui nous intéresse.
En pratique, tout dépend du concepteur du matériel et doit être vérifié très attentivement. Néanmoins, le fait demeure.
Si nous revenons à notre matériel, alors, malheureusement, tout n’est pas si rose. Semblable aux affirmations des fabricants de microphones et de haut-parleurs, le fabricant de cartes son ment également souvent sur les modes de fonctionnement de leurs appareils. Parfois, pour une carte son spécifique, on peut voir qu’elle fonctionne en mode 96k/24bit, alors qu’en réalité c’est toujours le même 48k/16bit. Ici, le problème peut être qu’à l’intérieur du pilote, le son peut vraiment être codé avec les paramètres spécifiés, bien qu’en réalité la carte son (DAC-ADC) ne puisse pas produire les caractéristiques nécessaires et rejeter simplement les bits les plus significatifs à la profondeur d’échantillonnage et sauter partie des fréquences à la fréquence d’échantillonnage. Les cartes son intégrées les plus simples ont souvent péché avec cela. Et bien que, comme nous l’avons découvert pour l’audition humaine, des paramètres tels que 40k / 10 bits soient tout à fait suffisants, pour le traitement du son, cela ne sera pas suffisant en raison des distorsions introduites lors du traitement du son. C’est-à-dire que si un ingénieur ou un musicien a filmé le son à l’aide d’un microphone ou d’une carte son moyen, alors en utilisant même les meilleurs logiciels et matériels, il sera très problématique de nettoyer tout le bruit et les erreurs qui ont été introduits au stade de l’enregistrement. Heureusement, les fabricants d’équipements audio semi-professionnels ou professionnels ne sont pas coupables de cela.
— Voir également: Les meilleures librairies de 2017 pour NI Kontakt 5! —
Le dernier problème est que les cartes son intégrées n’ont tout simplement pas un nombre suffisant de connecteurs nécessaires pour connecter les périphériques nécessaires. En fait, même un ensemble pour homme sous la forme d’un casque et d’une paire de moniteurs n’aura tout simplement nulle part où se connecter, et même des délices tels que des sorties avec alimentation fantôme et des commandes séparées pour chacun des canaux devront être complètement oubliés.
Total: la première chose qui doit être déterminée pour le choix ultérieur du type de carte son est ce que l’assistant va faire. Il est probable que pour un traitement approximatif, lorsqu’il n’est pas nécessaire d’enregistrer en haute qualité ou de simuler les « oreilles » de l’auditeur final, une carte son intégrée ou externe, mais relativement bon marché, peut suffire. Il peut également être utile pour les musiciens novices, s’ils ne sont pas trop paresseux pour gérer la réduction des retards dans le traitement en temps réel. Pour les maîtres qui sont exclusivement engagés dans le traitement hors ligne, vous ne devriez pas vous soucier de réduire les délais et de vous concentrer sur les appareils qui donneront réellement les hertz et les bits qu’ils sont censés fournir. Pour cela, il n’est pas nécessaire d’acheter une carte son trop chère ; dans la version la moins chère, une carte son « jeu » plus ou moins adéquate peut convenir. MAIS, j’attire votre attention sur le fait que les pilotes pour de telles cartes son essaient d’améliorer le son d’une certaine manière, ce qui est inacceptable, car pour le traitement, il est nécessaire d’obtenir le son aussi propre et équilibré que possible avec un minimum entrecoupé de pilote « amélioration ».
Cependant, si vous, en tant que maître, avez besoin d’un appareil qui répondra aux exigences de qualité du signal enregistré-reproduit, ainsi que de vitesse de traitement de ce signal, alors vous devrez soit payer un supplément, après avoir reçu un appareil de bonne qualité, ou choisissez 2 choses à sacrifier: haute qualité, bas prix, haute vitesse.