Quelle est la source de la mentalité «compilez-la vous-même» sous Linux [fermé]


11

J'ai utilisé Linux un peu au collège et je connais bien les termes. Je développe régulièrement dans des langages .NET, donc je ne suis pas analphabète en informatique.

Cela dit, je ne peux pas vraiment dire que je comprends la mentalité de «compiler vous-même» [CIY] qui existe dans les cercles * nix. Je sais que ça s'en va, mais j'entends quand même de temps en temps. En tant que développeur, je sais que la mise en place de compilateurs et des dépendances nécessaires est pénible, donc j'ai l'impression que les flux de travail CIY ont contribué à rendre * nix beaucoup moins accessible.

Quels facteurs sociaux ou techniques ont conduit à la montée de la mentalité CIY?


12
Vous l'entendez dans les cercles Linux ou UNIX ? Il ya une énorme différence.
terdon

2
Linux a tellement de distributions différentes que ce n'est vraiment pas une surprise. Maintenant que certaines distributions arrivent en tête de peloton, il existe des versions compilées, mais c'était un site Web qui n'était pas pratique.
Centimane

8
Et pour mémoire, «mettre en place des compilateurs et les dépendances nécessaires» sur un système Linux n'est en fait pas si difficile. Certains pourraient même dire facile.
Deathgrip

6
@Darren - C'est l'inverse, de nos jours la plupart des tarballs OpenSource suivent un standard qui n'existait pas il y a des années. Téléchargez tarball, extrayez tarball, cd dans le répertoire, exécutez ./configure <options>, puis faites et installez. Il y a 30 ans, je me suis fait des dents sur les serveurs AT&T 3B2 exécutant AT&T SysV Unix et Gould iron exécutant UTX. Les choses étaient beaucoup plus difficiles à l'époque. Certains avaient les débuts du configureprocessus, la plupart que vous deviez modifier manuellement makefile(s)pour votre système particulier.
Deathgrip

1
@Deathgrip En effet, avez-vous déjà essayé de configurer un environnement de développement Windows pour la programmation de systèmes sans Visual Studio? Presque impossible, je vous le dis.
cat

Réponses:


27

Très simplement, pour une grande partie de l'histoire de * nix, il n'y avait pas d'autre choix. Les programmes ont été distribués sous forme de fichiers tar source et la seule façon de les utiliser était de les compiler à partir des sources. Ce n'est donc pas tant une mentalité qu'un mal nécessaire.

Cela dit, il y a de très bonnes raisons de compiler des trucs vous-même car ils seront ensuite compilés spécifiquement pour votre matériel, vous pouvez choisir les options à activer ou non et vous pouvez donc vous retrouver avec un exécutable affiné, exactement comme vous l'aimez. . Cependant, cela n'est évidemment que quelque chose qui a du sens pour les utilisateurs experts et non pour ceux qui veulent simplement qu'une machine en état de marche lise leurs e-mails.

Maintenant, dans le monde Linux, les principales distributions se sont toutes éloignées de cela il y a de nombreuses années. De nos jours, vous avez très, très rarement besoin de compiler quoi que ce soit vous-même, à moins que vous n'utilisiez une distribution spécialement conçue pour les gens qui aiment faire ça comme Gentoo. Pour la grande majorité des distributions, cependant, votre utilisateur moyen n'aura jamais besoin de compiler quoi que ce soit, car presque tout ce dont il aura besoin est présent et compilé dans les référentiels de sa distribution.

Donc, cette mentalité CIY comme vous l'appelez a pratiquement disparu. Il est peut-être encore vivant et dynamique dans le monde UNIX, je n'y ai aucune expérience, mais sous Linux, si vous utilisez une distribution populaire avec un référentiel décent, vous n'aurez presque jamais besoin de compiler quoi que ce soit vous-même.


5
Dans le monde Unix, cela différera à nouveau en fonction du système d'exploitation. Mon dernier poste concernait un grand nombre de serveurs Solaris (plate-forme Sun Sparc) et j'ai exécuté Solaris 10 x86 à la maison en tant que bureau pendant quelques années. Je ne peux pas parler pour HPUX ou AIX, mais vous avez dû faire un peu de CIY sur Solaris. Sun a distribué un certain nombre d'utilitaires OpenSource pré-packagés pour Solaris. Il y avait aussi des sites comme opencsw.org et unixpackages.com. Mais j'ai quand même fait un peu de compilation à partir des archives tar source.
Deathgrip

"pour une grande partie de l'histoire de * nix, il n'y avait pas d'autre choix. Les programmes ont été distribués comme tarballs source." - mais c'est à cause de la mentalité CIY, non?
Woodrow Barlow

2
@woodrow pas vraiment. Il n'y avait pas d'autre choix disponible. N'oubliez pas que * nix est vieux . De plus, la plupart des programmes ont été transmis entre collègues qui étaient déjà des experts et pourquoi vous dérangeriez-vous d'inventer quelque chose d'aussi complexe qu'un installateur ou un gestionnaire de packages pour les 8 autres personnes qui utiliseraient votre code? Lorsque de tels outils ont été inventés, les gens de * nix ont commencé à les utiliser comme tout le monde.
terdon

@WoodrowBarlow Non, vous échangez des causes et des effets. Les programmes ont été distribués comme source car il y avait beaucoup de plates-formes différentes autour (différentes architectures matérielles, différents systèmes d'exploitation, différents ensembles de bibliothèques), donc un auteur de programme aurait dû distribuer des centaines ou des milliers de binaires pour les couvrir tous. CIY est toujours là pour les personnes qui exécutent des plates-formes «exotiques», mais une grande majorité utilise des plates-formes «grand public» où les binaires sont facilement disponibles à partir des distributions.
Gilles 'SO- arrête d'être méchant'

@terdon d'accord, je vois. je voudrais juste souligner, cependant, que ce paragraphe est un peu tautologique. à un certain niveau, l'OP a demandé "pourquoi les développeurs * nix distribuent-ils le code source au lieu des binaires compilés?" et votre premier paragraphe dit "parce que les développeurs * nix distribuent le code source au lieu des binaires compilés". oui, je réalise que je simplifie, mais je pense que votre réponse serait plus claire si vous ajoutez les arguments de votre commentaire dans le texte de la réponse.
Woodrow Barlow

13

Il y a plusieurs causes à cette mentalité, des utilisateurs finaux, des responsables de la distribution et des fournisseurs / développeurs / groupes de projets de code, et chacun d'entre eux est parfaitement valide.

L'aspect Open Source

Il y en a qui aiment savoir qu'ils utilisent un logiciel libre et le valident en choisissant de compiler à partir de la source. C'est là que des choses comme le projet / guide / guide / livre Linux From Scratch entrent en jeu.

L'optimisation et l'aspect des options

Vous souhaitez compiler des éléments avec des optimisations spécifiques pour votre architecture de processeur particulière? Il existe peut-être une option de compilation (ou un correctif pour en créer une) pour activer ou désactiver une fonctionnalité particulière dont vous avez besoin. Des exemples de cela pourraient être de corriger postfix pour avoir la capacité de gérer les quotas, ou d'utiliser une distribution comme Gentoo où vous pouvez choisir de ne pas utiliser systemd, ou vous choisissez spécifiquement de prendre en charge ogg / theora / vorbis / que ce soit et PAS mp3 en raison de problèmes de licence ou peu importe.

L'aspect de l'architecture CPU

Votre lieu de travail utilise-t-il des machines haut de gamme non x86 / amd64? Le package dont vous avez besoin / souhaitez peut ne pas être disponible précompilé pour votre architecture CPU, et encore moins quelle que soit la distribution que vous exécutez. Certes, la plupart des endroits exécutant ce type de matériel sont également pris en charge par IBM, etc. et ne vont pas installer / compiler des trucs à volonté. Mais que se passe-t-il si vous en achetez un dans une vente excédentaire, que vous déterrez un ancien iMac avec processeur PPC, etc.?

L'aspect Distribution

Les «familles» de distribution - c'est-à-dire Debian avec Ubuntu, Mint et al et RedHat avec CentOS, Whitebox, Fedora et al - utilisent toutes des formats de package différents. Et chaque version est livrée avec différentes versions de bibliothèque, etc. Même pour un simple script shell de fichier unique, la configuration d'un fichier Debian .deb approprié prend du temps et des efforts. Si vous avez écrit un logiciel pour éliminer les démangeaisons et que vous vouliez le rendre gratuit et le publier sur gitlab, votre propre serveur Web, peu importe, préférez-vous simplement publier un fichier source générique .tar.gz avec des instructions sur la construction ou préférez-vous empaqueter des versions pour 2 versions de Debian (stable et test, peut-être oldstable), plusieurs versions de Redhat et Fedora en tant que RPM, un TGZ pour Slackware, un profil ebuild pour Gentoo, etc. etc. etc.


1
Une autre raison est parfois que la source en amont corrige un bogue non critique pour une fonctionnalité qui fonctionnait dans une version précédente mais qui a depuis été rompue. Cependant, le package pour une distribution plus stable peut ne pas mettre à jour le package pendant des semaines, voire des mois. C'est une des raisons pour lesquelles un utilisateur normal peut vouloir apprendre à compiler certaines choses à partir de la source. De plus, même les distributions avec une réputation de logiciels de pointe dans leurs dépôts comme Arch vont prendre du retard à un moment donné. Compiler à partir des sources signifie que je peux avoir tout ce que vous avez mentionné, ainsi que toutes les nouvelles fonctionnalités qui pourraient avoir été introduites.

@ChronoKitsune Très vrai; comparer les versions de package dans Gentoo (une distribution CIY) à toute autre distribution. Beaucoup plus récent. Faire des instructions de compilation est mille fois plus facile que de créer un paquet binaire qui fonctionnera sur toutes les architectures. Cela signifie que vous pouvez utiliser de nouvelles fonctionnalités logicielles intéressantes que d'autres ne verront pas pendant un certain temps.
dogoncouch

9

Comme le dit @terdon, de nos jours, le besoin de compiler des choses est assez mince, en particulier pour les utilisateurs à domicile.

Dans le passé, dans le monde Unix, j'étais fortement tributaire de la compilation de sources, par exemple, car je gérais des systèmes Solaris, AIX, Ultrix, Digital Ultrix et HP / UX qui n'étaient parfois plus maintenus par le fournisseur ou quelles implémentations des services communs étaient loin derrière ce qui était couramment utilisé par d'autres Unix, y compris Linux.

Il existe encore de réels besoins de compilation dans le présent, soit pour obtenir un logiciel plus obscur ou obsolète qui ne se trouve pas dans les référentiels, soit pour utiliser une version plus récente d'un package pour lequel vous n'avez pas de binaires compatibles, ou lorsque vous souhaitez ajouter des fonctionnalités supplémentaires ou rarement, si vous pouvez écrire un patch ou un module pour celui-ci.

J'ai également dû compiler des logiciels à la main lors de la réingénierie des systèmes pour le portage vers Debian et / ou les nouvelles versions de Debian qui avaient un cadre qui n'était plus pris en charge par le système d'exploitation.

Par exemple, dans le passé, je devais compiler à la main des démons DHCP pour prendre en charge les modifications de Windows (alors récentes) du protocole, ou pour prendre en charge des correctifs spécifiques pour l'approvisionnement dans le monde des télécommunications.

Je garde toujours dans mes dépôts locaux les versions de FreeRadius compilées par moi-même à partir du repo dev git, car il y avait une chaîne de versions stables qui avaient des bogues (graves) dans Debian, et généralement les .debs correspondants pour Debian / Ubuntu n'ont pas été adapté à nos besoins.

Et il va sans dire que de temps en temps, nous devons également exécuter / ou compiler des choses écrites par nous-mêmes.

De nos jours, l'installation des dépendances n'est pas aussi difficile que par le passé, et certains logiciels ont même des fichiers de règles personnalisés pour certaines distributions Linux courantes qui nomment les dépendances à compiler et effectuent le gros travail de création du fichier de package avec la liste des dépendances intégrée. L'installation d'un tel package à partir d'un référentiel local n'est pas très différente de l'installation du même package à partir des référentiels officiels.


4

Quels facteurs sociaux ou techniques ont conduit à la montée de la mentalité CIY?

La cause première est bien évidemment la raison technique: la portabilité binaire est plus difficile que la portabilité source . En dehors des packages de distribution, la plupart des logiciels gratuits ne sont toujours disponibles que sous forme source, car cela est beaucoup plus pratique pour les auteurs / mainteneurs.

Jusqu'à ce que les distributions Linux commencent à empaqueter la plupart des choses que les gens ordinaires voudraient utiliser, votre seule option était d'obtenir la source et de la compiler pour votre propre système. Les fournisseurs commerciaux Unix n'incluaient généralement pas des éléments que presque tout le monde voulait (par exemple un joli shell comme GNU bashou similaire), juste leur propre implémentation de shet / ou csh, donc vous deviez créer des éléments vous-même si vous (en tant qu'administrateur système) vouliez pour fournir un environnement Unix agréable à vos utilisateurs pour une utilisation interactive.

La situation actuelle, la plupart des gens étant le seul administrateur et le seul utilisateur de la machine assis sur leur bureau, est très différente du modèle Unix traditionnel. Un administrateur système a géré le logiciel sur le système central et sur le bureau de chacun. (Souvent , en installant simplement les postes de travail des gens sur NFS /optet à /usr/local/partir du serveur central, et en y installant des éléments.)


Avant des choses comme .NET et Java, la véritable portabilité binaire entre différentes architectures CPU était impossible. La culture Unix a évolué avec la portabilité source comme valeur par défaut pour cette raison, avec peu d'efforts pour même essayer d'activer la portabilité binaire jusqu'aux récents efforts Linux comme LSB. Par exemple, POSIX ( le principal standard Unix) tente uniquement de standardiser la portabilité des sources, même dans les versions récentes.

Facteur culturel connexe: AT&T Unix commercial est venu avec le code source (sur bandes). Vous ne l' avez pas avoir à construire le système de la source, il était juste là au cas où vous vouliez voir comment quelque chose vraiment travaillé quand les documents ne suffisaient pas.

Wikipédia dit :

"La politique Unix de documentation en ligne complète et (pendant de nombreuses années) un accès rapide à tout le code source du système a suscité les attentes des programmeurs et a contribué au lancement en 1983 du mouvement du logiciel libre."

Je ne sais pas ce qui a motivé cette décision, car donner aux clients l'accès au code source des logiciels commerciaux est inconnu de nos jours. Il y a clairement quelques premiers biais culturels dans cette direction, mais cela est peut-être né des racines d'Unix en tant qu'OS portable écrit principalement en C (pas en langage assembleur) qui pourrait être compilé pour différents matériels. Je pense que de nombreux systèmes d'exploitation antérieurs avaient plus de code écrit en asm pour un processeur spécifique, donc la portabilité au niveau de la source était l'une des premières forces d'Unix. (Je peux me tromper à ce sujet; je ne suis pas un expert des premiers Unix, mais Unix et C sont liés.)


La distribution de logiciels sous forme source est de loin le moyen le plus simple de permettre aux utilisateurs de l'adapter au système sur lequel ils souhaitent fonctionner. (Soit les utilisateurs finaux, soit les personnes qui le conditionnent pour une distribution Linux). Si le logiciel a déjà été empaqueté par / pour une distribution, les utilisateurs finaux peuvent simplement l'utiliser.

Mais c'est beaucoup trop de s'attendre à ce que les auteurs de la plupart des packages créent eux-mêmes des fichiers binaires pour chaque système possible. Certains projets majeurs fournissent des binaires pour quelques cas courants (en particulier x86 / windows où le système d'exploitation n'est pas fourni avec un environnement de génération, et le fournisseur du système d'exploitation a mis l'accent sur la distribution des programmes d'installation uniquement binaires).

Faire fonctionner un logiciel sur un système différent de celui utilisé par l'auteur peut même nécessiter quelques petites modifications, qui sont faciles avec la source . Un petit programme unique que quelqu'un a écrit pour se gratter n'a probablement jamais été testé sur la plupart des systèmes obscurs. La possession de la source permet d'effectuer de tels changements. L'auteur d'origine a peut-être oublié quelque chose ou écrit intentionnellement du code moins portable, car cela a fait gagner beaucoup de temps. Même les principaux packages comme Info-ZIP n'avaient pas de testeurs sur chaque plate-forme tout de suite, et avaient besoin de personnes pour envoyer leurs correctifs de portabilité lorsque des problèmes étaient découverts.

(Il existe d'autres types de problèmes de portabilité au niveau de la source qui ne se produisent qu'en raison de différences dans la construction env, et ne sont pas vraiment pertinents pour le problème ici. Avec la portabilité binaire de style Java, les outils automatiques ( autoconf/ auto-make) et des choses similaires comme le cmakeferait Et nous n'aurions pas de choses comme certains systèmes nécessitent l'inclusion de <netinet/in.h>au lieu de<arpa/inet.h> forntohl(3) (et peut-être que nous n'aurions pas ntohl()ou tout autre ordre des octets en premier lieu!)


Je développe régulièrement dans des langages .NET, donc je ne suis pas analphabète en informatique.

Compiler une fois, exécuter n'importe où est l'un des principaux objectifs de .NET et de Java, il est donc juste de dire que des langages entiers ont été inventés dans le but de résoudre ce problème , et votre expérience de développement est avec l'un d'eux. Avec .NET, votre binaire s'exécute sur un environnement d'exécution portable (CLR) . Java appelle son environnement d'exécution la machine virtuelle Java . Vous n'avez besoin de distribuer qu'un seul binaire qui fonctionnera sur n'importe quel système (au moins, tout système où quelqu'un a déjà implémenté une JVM ou CLR). Vous pouvez toujours avoir des problèmes de portabilité comme, par /rapport aux \séparateurs de chemin, ou comment imprimer, ou les détails de mise en page de l'interface graphique, bien sûr.

De nombreux logiciels sont écrits dans des langages entièrement compilés en code natif . Il n'y a pas .netou de bytecode java, juste du code machine natif pour le CPU sur lequel il fonctionnera, stocké dans un format de fichier exécutable non portable. C et C ++ en sont les principaux exemples, en particulier dans le monde Unix. Évidemment, cela signifie qu'un binaire doit être compilé pour une architecture CPU spécifique.

Les versions de bibliothèque sont un autre problème . Les bibliothèques peuvent et maintiennent souvent l'API au niveau source stable tout en modifiant l'ABI au niveau binaire. (Voir Différence entre l'API et l'ABI .) Par exemple, l'ajout d'un autre membre à un opaque structchange toujours sa taille et nécessite une recompilation avec des en-têtes pour la nouvelle version de la bibliothèque pour tout code qui alloue de l'espace pour une telle structure, qu'elle soit dynamique (malloc ), statique (global) ou automatique (local sur la pile).

Les systèmes d'exploitation sont également importants . Une autre saveur d'Unix pour la même architecture CPU peut avoir différents formats de fichiers binaires, un autre ABI pour faire des appels système, et différentes valeurs numériques pour les constantes comme fopen(3)« s O_RDONLY, O_APPEND,O_TRUNC .

Notez que même un binaire lié dynamiquement a toujours du code de démarrage spécifique au système d'exploitation qui s'exécute avant main(). Sous Windows, c'est le cas crt0. Unix et Linux ont la même chose, où du code de démarrage C-Runtime est lié statiquement à chaque binaire. Je suppose qu'en théorie, vous pourriez concevoir un système où ce code était également lié dynamiquement, et une partie de libc ou de l'éditeur de liens dynamique lui-même, mais ce n'est pas ainsi que les choses fonctionnent dans la pratique sur n'importe quel système d'exploitation que je connaisse. Cela ne résoudrait que le problème ABI d'appel système, pas le problème des valeurs numériques pour les constantes des fonctions de bibliothèque standard. (Normalement, les appels système sont effectués via les fonctions de wrapper libc: un binaire Linux x86-64 normal pour la source qui utilise mmap()n'inclura pas l' syscallinstruction, juste uncall instruction à la fonction wrapper libc du même nom.

C'est en partie pourquoi vous ne pouvez pas simplement exécuter des binaires i386-FreeBSD sur i386-Linux. (Pendant un certain temps, le noyau Linux avait une couche de compatibilité des appels système. Je pense qu'au moins un des BSD peut exécuter des binaires Linux, avec une couche de compatibilité similaire, mais vous avez bien sûr besoin de bibliothèques Linux.)


Si vous souhaitez distribuer des binaires, vous devez en créer un distinct pour chaque combinaison de versions CPU / OS-version + saveur / bibliothèque-installée .

Dans les années 80 et 90, il existait de nombreux types différents de CPU couramment utilisés pour les systèmes Unix (MIPS, SPARC, POWER, PA-RISC, m68k, etc.), et de nombreuses versions différentes d'Unix (IRIX, SunOS, Solaris, AIX, HP-UX, BSD, etc.).
Et ce ne sont que des systèmes Unix . De nombreux packages source compileraient et fonctionneraient également sur d' autres systèmes, comme VAX / VMS, MacOS (m68k et PPC), Amiga, PC / MS-DOS, Atari ST, etc.

Il existe encore de nombreuses architectures CPU et OS, bien que maintenant une grande majorité des ordinateurs de bureau exécutent x86 l'un des trois principaux OS.

Il y a donc déjà plus de combinaisons CPU / OS que vous ne pouvez le faire, avant même de commencer à penser aux dépendances sur des bibliothèques tierces qui pourraient être dans différentes versions sur différents systèmes. (Tout ce qui n'est pas emballé par le fournisseur du système d'exploitation devrait être installé à la main.)

Tous les chemins qui sont compilés dans le binaire sont également spécifiques au système. (Cela économise de la RAM et du temps par rapport à leur lecture dans un fichier de configuration au démarrage). Les systèmes Unix de la vieille école comportaient généralement beaucoup de choses personnalisées à la main, il n'y a donc aucun moyen de faire des hypothèses valides sur où.

La distribution de binaires était totalement irréalisable pour la vieille école Unix, sauf pour les grands projets commerciaux qui peuvent se permettre de construire et de tester toutes les principales combinaisons .

Même faire des binaires juste i386-linux-gnuet amd64-linux-gnuc'est difficile. Beaucoup de temps et d'efforts ont été consacrés à des choses comme la base standard Linux pour rendre les binaires portables possibles . Même la liaison statique de fichiers binaires ne résout pas tout. (par exemple, comment un programme de traitement de texte devrait-il s'imprimer sur un système RedHat par rapport à un système Debian? Comment l'installation devrait-elle ajouter un utilisateur ou un groupe pour un démon et organiser l'exécution de son script de démarrage après chaque redémarrage?) exemples, car la recompilation à partir de la source ne les résout pas.


En plus de tout cela, la mémoire de l'époque était plus précieuse qu'elle ne l'est aujourd'hui. La suppression des fonctionnalités facultatives au moment de la compilation peut créer des binaires plus petits (moins de taille de code) qui utilisent également moins de mémoire pour leurs structures de données. Si une fonctionnalité nécessitait un membre supplémentaire dans chaque instance d'un certain classou structpour suivre quelque chose, la désactivation de cette fonctionnalité réduira l'objet de 4 octets (par exemple), ce qui est bien si c'est un objet dont le programme alloue 100k.

De nos jours, les fonctionnalités de compilation facultatives sont le plus souvent utilisées pour rendre les bibliothèques supplémentaires facultatives. par exemple , vous pouvez compiler ffmpegavec ou sans libx264, libx265, libvorbiset beaucoup d' autres bibliothèques pour les codeurs vidéo / audio spécifiques, la gestion des sous - titres, etc. , etc. Plus généralement, beaucoup de choses peuvent être compilés avec ou sans libreadline: si elle est disponible lorsque vous exécutez ./configure, la le binaire résultant dépendra de la bibliothèque et fournira une édition de ligne sophistiquée lors de la lecture à partir d'un terminal. Si ce n'est pas le cas, le programme utilisera un support de secours pour lire simplement les lignes de la stdin avec fgets()ou quelque chose.)

Certains projets utilisent toujours des fonctionnalités facultatives pour supprimer le code inutile pour des raisons de performances. Par exemple, le noyau Linux lui-même peut être construit sans prise en charge SMP (par exemple pour un système intégré ou un ancien bureau), auquel cas une grande partie du verrouillage est plus simple. Ou avec de nombreuses autres fonctionnalités facultatives qui affectent une partie du code principal, et pas seulement en laissant de côté les pilotes ou d'autres fonctionnalités matérielles. (Bien que les options de configuration spécifiques à l'archive et au matériel représentent une grande partie du code source total. Voir Pourquoi le noyau Linux compte-t-il plus de 15 millions de lignes de code? )

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.