pourquoi les gens font-ils des API REST au lieu de DBAL?

32

Au cours des deux dernières sociétés, je travaillais avec des API REST pour interroger des données via une application Web. c'est à dire. au lieu que l'application Web utilise le code SQL directement, elle appelle une API REST, qui effectue le code SQL et renvoie le résultat.

Ma question est ... pourquoi est-ce fait?

Si cela devait être exposé à des tiers, je pourrais comprendre. Mieux vaut exposer une API REST limitée que la base de données complète. Mais dans ces deux entreprises, ce n'est pas le cas.

On m'a suggéré que ces API REST facilitent la commutation entre les SGBD. Mais n'est-ce pas le but d'une couche d'abstraction de base de données (DBAL)? Peut-être utilisez-vous un ORM comme base de données DBAL ou écrivez-vous du SQL brut et demandez-lui de traduire les éléments spécifiques à la base de données, le cas échéant (par exemple, translate LIMIT for MySQL to TOP pour MSSQL).

De toute façon, cela me semble inutile. Et je pense que cela complique également le diagnostic des problèmes. Si un rapport sur l'application Web donne les mauvais numéros, vous ne pouvez pas vider la requête SQL. Vous devez vider l'URL REST, puis accéder au projet servant d'API REST et en extraire le SQL. C'est donc une couche d'indirection supplémentaire qui ralentit le processus de diagnostic.

— Neubert
source

3

Il semble que vous n'ayez travaillé qu'avec des applications fondamentalement CRUD: certains utilisateurs saisissent des données avec des formulaires et d'autres les lisent avec les mêmes formulaires ou avec des rapports d'impression? Si vous n'avez jamais travaillé avec un système nécessitant un modèle de domaine complexe et sophistiqué, je peux voir comment vous pourriez avoir cet état d'esprit particulier. De nombreuses applications nécessitent cette couche supplémentaire d'indirection pour effectuer des tâches.

— RibaldEddie

1

J'ai travaillé avec des API (pas nécessairement REST) qui (entre autres choses) effectuaient des calculs sur les paramètres qui lui étaient transmis. Peut-être qu'un SGBD est utilisé dans ces calculs, mais une grande partie de la logique ne réside probablement pas dans la base de données. Cependant, les API internes des entreprises dans lesquelles j'ai travaillé ne le font pas. Ils se contentent d'interroger un SGBD et d'extraire les résultats de la requête SQL in extenso. Il me semble simplement que les API REST sont souvent (pas toujours - souvent) écrites pour être à la mode - pas pour être pratiques.

— neubert

1

La conception des API REST présente certes des défauts qui rendent difficile la conception d'un domaine complexe. La plupart des développeurs que j'ai rencontrés au cours des années ne s'intéressent pas à la conception. Ils veulent créer du code le plus rapidement possible pour que leurs patrons les aiment et pensent qu'ils sont des stars du rock. Lorsque vous combinez ce fait avec une tendance telle que REST, vous obtenez une API de spaghetti tendance mais peu pratique. Cela n'a rien à voir avec REST lui-même.

— RibaldEddie

3

Vous êtes-vous déjà demandé comment certaines entreprises Web signalent que leurs fichiers d'utilisateurs ont été volés par un pirate informatique? Vous êtes-vous déjà demandé comment le pirate informatique l'a fait? Lorsque vous pensez qu'un serveur Web a une connexion directe à la base de données, vous vous rendez compte qu'une fois le serveur Web piraté, l'attaquant dispose d'un accès complet et illimité pour sélectionner un élément de la base de données qu'il souhaite. Collez-le derrière un niveau intermédiaire et l'attaquant ne peut alors appeler des méthodes que sur le niveau intermédiaire. Je ne dirai pas que c'est une sécurité instantanée, mais c'est nettement mieux.

— gbjbaanb

1

@gbjbaanb: Mon problème est que le serveur Web peut accéder aux données via le serveur de repos. Par conséquent, si le serveur Web est piraté, l'attaquant peut également accéder aux données via le serveur de reste sans avoir à pirater le serveur de reste.

— JacquesB

28

Si vous autorisez un client à accéder directement à la base de données - ce qu'il ferait, même avec une couche d'abstraction de base de données, alors:

Vous obtenez un couplage entre leur code et le vôtre - en particulier, il existe un très fort couplage entre la structure de votre base de données et leur code;
Votre client peut faire des choses plutôt indésirables sur votre base de données - que ce soit mettre à jour des données qu’ils ne devraient pas, écrire une requête qui prend trop de temps, bloquer quelque chose parce qu’ils n’acquièrent pas les verrous proprement ...
Si vous avez fait un choix peu optimal dans la structure de votre base de données, il peut s'avérer très difficile de sortir de ce choix, surtout si vous ne disposez pas d'un moyen efficace de faire migrer vos clients vers de nouvelles structures.

Autrement dit, je ne touche pas du tout à la partie REST - isoler votre base de données derrière une API est tout simplement un choix plus judicieux si l'équipe qui gère la base de données et les équipes qui l'utilisent ne sont pas synchronisées, car cela permet à ces parties de évoluer à leur rythme.

— jhominal
source

24

Vous avez raison, il n'y a aucun avantage clair à introduire une couche d'API REST entre une application Web et une base de données, et cela a un coût en complexité et en performances.

La raison pour laquelle vous obtenez des réponses contradictoires est la confusion quant au "client" de votre architecture.

Dans votre architecture (si je comprends bien), les navigateurs interagissent avec une seule application Web, laquelle interagit à son tour avec la base de données. L'introduction d'une couche d'API REST entre l'application Web et la base de données ne présente aucun avantage. Tous les avantages énoncés (mise en cache, isolation de la base de données, etc.) peuvent être obtenus avec une ou plusieurs couches d'accès aux données dans le code.

Mais il existe d' autres architectures dans lesquelles une API REST est logique:

Si vous avez plusieurs clients accédant à la base de données, c’est-à-dire non pas une application Web unique, mais plusieurs applications Web indépendantes accédant à la même base de données. Il peut être avantageux de créer une interface REST commune pour permettre le partage de modèle de données, la mise en cache, etc. Bien sûr, vous pouvez obtenir certains avantages en partageant les mêmes bibliothèques DAL, mais cela ne fonctionnera pas si les applications sont développées dans différentes langues et sur différentes versions. plates-formes. Ceci est courant dans les systèmes d'entreprise.
Si plusieurs applications de bureau accèdent directement à la base de données. Il s’agit de l’architecture classique «à deux niveaux», qui n’est plus à la mode par rapport aux applications Web. L'introduction d'une couche REST vous permet de centraliser la logique d'accès aux données et, en particulier, de mieux contrôler la sécurité, car plusieurs clients distribués accèdent directement à la même base de données.
Si vous avez du code JavaScript qui extrait directement les données du serveur, vous avez besoin de quelque chose comme une API REST dans tous les cas.

— JacquesB
source

1

J'ai aimé votre réponse, mais j'ai quelques autres questions qui l'accompagnent. Comme en est-il de la perte de performance avec l'introduction d'une autre couche d'abstraction? En outre, ne constitue-t-il pas un point d'échec unique (si cela tombe en panne, tout le reste tombe en panne) et un goulot d'étranglement possible (chaque application attend une connexion à la base de données depuis le pool)?

— dimanche

@satich: Je ne comprends pas exactement ce que vous demandez, pouvez-vous être plus précis? Voulez-vous parler d'un point de défaillance unique avec ou sans niveau REST?

— JacquesB

La couche supplémentaire peut être utile si plusieurs applications communiquent avec elle

— Ewan

@Ewan: Oui, c'est ce que je dis dans la première puce.

— JacquesB

1

@JacquesB Supposons que plusieurs applications Web partagent la même base de données mais pas les mêmes données, c’est-à-dire qu’elles effectuent toutes des opérations CRUD sur un ensemble de données distinct de cette base de données. En principe, il n’ya pas de partage de données à proprement parler. Donc, placer des applications derrière une structure de persistance reposante a-t-il un sens (supposons également que la base de données offre un bon niveau de simultanéité dans les requêtes)? En outre, ce cadre ne constituera-t-il pas un goulet d'étranglement et un point d'échec unique pour de nombreuses applications Web qui interagissent via celui-ci?

— mardi

12

Attention: gros post, quelques opinions, vague "faites ce qui vous convient le mieux" conclusion

Généralement, ceci est utilisé pour implémenter une «architecture hexagonale» autour de votre base de données. Vous pouvez avoir des applications Web, des applications mobiles, des applications de bureau, des importateurs en masse et un traitement en arrière-plan qui consomment votre base de données de manière uniforme. Vous pouvez certainement accomplir la même chose dans une certaine mesure en écrivant une bibliothèque riche pour accéder à votre base de données et en faisant en sorte que tous vos processus l'utilisent. Et en effet, si vous êtes dans un petit magasin avec un système très simple, c'est probablement une meilleure voie à suivre; C'est une approche plus simple et si vous n'avez pas besoin des fonctionnalités avancées d'un système plus complexe, pourquoi payer pour la complexité? Toutefois, si vous travaillez avec un grand ensemble sophistiqué de systèmes qui doivent tous interagir avec votre base de données à grande échelle, il existe

Indépendance et maintenance de la plateforme

Si vous avez une base de données et que vous écrivez une bibliothèque Python pour interagir avec cette base de données, et que tout le monde l'utilise pour interagir avec la base de données, c'est génial. Mais disons que vous devez soudainement écrire une application mobile et que cette application mobile doit désormais également parler à la base de données. Et vos ingénieurs iOS n'utilisent pas Python et vos ingénieurs Android n'utilisent pas Python. Peut-être que les gars d'iOS veulent utiliser les langages d'Apple et les ingénieurs d'Android veulent utiliser Java. Ensuite, vous seriez bloqué à écrire et à maintenir votre bibliothèque d’accès aux données dans 3 langues différentes. Peut-être que les développeurs iOS et Android décident d’utiliser quelque chose comme Xamarin pour maximiser le code qu’ils peuvent partager. Parfait, sauf que vous allez probablement devoir porter votre bibliothèque d'accès aux données au format .NET. Et puis votre entreprise vient d’acheter une autre entreprise qui ' L'application Web de s est un produit disparate mais lié, et l'entreprise souhaite intégrer certaines des données de la plate-forme de votre société à la plate-forme de la filiale récemment acquise. Seul problème: la filiale était une start-up et a décidé d'écrire l'essentiel de son application dans Dart. De plus, pour une raison quelconque (probablement indépendante de votre volonté), l'équipe mobile qui pilotait Xamarin a décidé que ce n'était pas pour eux, et qu'ils préféraient utiliser les outils et les langages spécifiques aux appareils mobiles pour lesquels ils développeraient. Mais pendant que vous en étiez dans cette phase, votre équipe avait déjà livré une grande partie de votre bibliothèque d’accès aux données dans .NET, et une autre équipe de la société écrivait des éléments d’intégration dingues Salesforce et a décidé de faire tout cela dans .NET car était déjà une bibliothèque d'accès aux données pour.

Alors maintenant, à cause d’une tournure très réaliste des événements, votre bibliothèque d’accès aux données est écrite en Python, .NET, Swift, Java et Dart. Ils ne sont pas aussi beaux que vous le souhaiteriez. Vous ne pouvez pas utiliser un ORM aussi efficacement que vous le souhaitez, car chaque langue possède des outils ORM différents, vous avez donc dû écrire plus de code que vous n'auriez souhaité. Et vous n'avez pas été en mesure de consacrer autant de temps que vous l'auriez souhaité à chaque incarnation, car il y en a cinq. Et la version Dart de la bibliothèque est particulièrement poilue parce que vous deviez rouler vous-même vos données transactionnelles, car les bibliothèques et le support technique n’étaient tout simplement pas au rendez-vous. Vous avez essayé de faire valoir que, pour cette raison, l’application Dart ne devait disposer que de fonctionnalités en lecture seule pour votre base de données, mais l'entreprise avait déjà décidé que toutes les fonctionnalités envisagées en valaient la peine. Et il s'avère qu'il y a un bogue dans la logique de validation qui existe dans toutes ces incarnations de votre bibliothèque d'accès aux données. Maintenant, vous devez écrire des tests et du code pour corriger ce bogue dans toutes ces bibliothèques, obtenir des critiques de code pour toutes les modifications apportées à ces bibliothèques, obtenir un contrôle de qualité sur toutes ces bibliothèques et publier vos modifications sur tous les systèmes en utilisant toutes les versions. ces bibliothèques. Pendant ce temps, vos clients sont mécontents et ont adopté Twitter, réunissant des combinaisons de vulgarités que vous n'auriez jamais imaginées imaginables, sans parler du produit phare de votre entreprise. Et le responsable du produit décide de ne pas être du tout conscient de la situation.

S'il vous plaît, comprenez que dans certains environnements, l'exemple ci-dessus est tout sauf artificiel. Tenez également compte du fait que cette séquence d'événements peut se dérouler au cours de quelques années. Généralement, lorsque vous arrivez au point où architectes et hommes d’affaires commencent à parler de la connexion d’autres systèmes à votre base de données, c’est à ce moment-là que vous allez vouloir «placer une API REST devant la base de données» sur votre feuille de route. Pensez si, dès le début, quand il était clair que cette base de données allait commencer à être partagée par quelques systèmes, un API de service Web / REST était placé devant elle. La correction de votre bogue de validation serait beaucoup plus rapide et facile car vous le faites une fois au lieu de cinq fois. Et publier le correctif serait beaucoup plus facile à coordonner, car vous

TLDR; Il est plus facile de centraliser la logique d'accès aux données et de maintenir des clients HTTP très minces que de distribuer la logique d'accès aux données à chaque application devant accéder aux données. En fait, votre client HTTP peut même être généré à partir de méta-données. Dans les grands systèmes, l’API REST vous permet de gérer moins de code

Performance et évolutivité

Certaines personnes peuvent penser que le fait de communiquer directement avec la base de données au lieu de passer par un service Web est plus rapide. Si vous n'avez qu'une seule application, c'est certainement vrai. Mais dans les grands systèmes, je ne suis pas d'accord avec le sentiment. Éventuellement, à un certain niveau d’échelle, il sera très utile de mettre une sorte de cache en face de la base de données. Vous utilisez peut-être Hibernate et souhaitez installer une grille Infinispan en tant que cache L2. Si vous disposez d'un cluster de 4 serveurs robustes pour héberger votre service Web séparément de vos applications, vous pouvez vous permettre de disposer d'une topologie intégrée avec réplication synchrone activée. Si vous essayez de placer cela sur un cluster de 30 serveurs d'applications, l'activation de la réplication dans cette configuration sera trop lourde. Vous devrez soit exécuter Infinispan en mode distribué ou dans une sorte de topologie dédiée, et soudainement, Hibernate devra sortir sur le réseau pour pouvoir lire dans le cache. De plus, Infinispan ne fonctionne qu'en Java. Si vous avez d'autres langues, vous aurez besoin d'autres solutions de mise en cache. La surcharge réseau de devoir passer de votre application à votre service Web avant d’atteindre la base de données est rapidement compensée par la nécessité d’utiliser des solutions de mise en cache beaucoup plus compliquées qui viennent généralement avec une charge supplémentaire.

En outre, cette couche HTTP de votre API REST fournit un autre mécanisme de mise en cache précieux. Les serveurs de votre API REST peuvent placer des en-têtes de mise en cache sur leurs réponses. Ces réponses peuvent être mises en cache au niveau de la couche réseau, qui évolue exceptionnellement bien. Dans une petite configuration, avec un ou deux serveurs, le mieux est simplement d’utiliser un cache en mémoire dans l’application lorsque celle-ci communique avec la base de données, mais dans une grande plate-forme avec de nombreuses applications exécutées sur de nombreux serveurs, vous réseau pour gérer votre mise en cache, car une fois correctement configuré, quelque chose comme calmar ou vernis ou nginx peut évoluer à des niveaux insensés sur un matériel relativement petit. Des centaines de milliers ou des millions de requêtes par seconde de débit coûtent beaucoup moins cher à partir d'un cache HTTP que d'un serveur d'applications ou d'une base de données.

En plus de cela, le fait d'avoir une tonne de clients pointés sur votre base de données, au lieu de les faire tous pointer sur quelques serveurs pointant vers la base de données, peut rendre le réglage de la base de données et du pool de connexions beaucoup plus difficile. En général, la majeure partie de la charge de travail réelle d'un serveur d'applications est constituée d'applications. Attendre que les données reviennent de la base de données prend souvent beaucoup de temps, mais coûte généralement très peu en calcul. Vous aurez peut-être besoin de 40 serveurs pour gérer la charge de travail de votre application, mais vous n'avez probablement pas besoin de 40 serveurs pour orchestrer l'extraction des données de la base de données. Si vous dédiez cette tâche à un service Web, celui-ci s'exécutera probablement sur beaucoup moins de serveurs que le reste de l'application, ce qui signifie que vous aurez besoin de beaucoup moins de connexions à la base de données. Ce qui est important, car les bases de données ne

TLDR; Il est plus facile d'ajuster, de mettre à l'échelle et de mettre en cache l'accès à vos données lorsque cela se produit dans un seul service Web dédié plutôt que dans de nombreuses applications utilisant différentes langues et technologies.

Dernières pensées

S'il vous plaît, ne quittez pas cette pensée "Oh wow, je devrais toujours utiliser des API REST pour obtenir mes données" ou "Cet idiot essaie de dire que nous le faisons mal parce que notre application Web communique directement avec la base de données, mais nos affaires fonctionnent bien! " . Ce que je veux surtout dire, c’est que différents systèmes et différentes entreprises ont des exigences différentes; Dans de nombreux cas, placer une API REST en face de votre base de données n’a vraiment aucun sens. C'est une architecture plus compliquée qui nécessite de justifier cette complexité. Mais lorsque la complexité est garantie, l’API REST présente une foule d’avantages. Être capable de peser les différentes préoccupations et de choisir la bonne approche pour votre système est ce qui fait un bon ingénieur.

De plus, si l'API REST vous empêche de déboguer des choses, il y a probablement quelque chose qui ne va pas ou qui manque dans cette image. Je ne crois pas que le fait d'avoir cette couche d'abstraction ajoutée rend intrinsèquement plus difficile le débogage. Lorsque je travaille avec de grands systèmes n-tiers, j'aime m'assurer que le contexte de journalisation est distribué. Peut-être que lorsqu'un utilisateur lance une demande, générez un GUID pour cette demande et enregistrez le nom d'utilisateur de cet utilisateur et la demande qu'il a faite. Ensuite, transmettez ce GUID pendant que votre application parle à d'autres systèmes. Avec une agrégation et une indexation appropriées des journaux, vous pouvez interroger toute la plate-forme sur l'utilisateur signalant le problème. Vous avez ainsi la possibilité de visualiser toutes ses actions. Elles parcourent ensuite le système pour identifier rapidement les dysfonctionnements. Encore une fois, c'est une architecture plus compliquée,

Sources: http://alistair.cockburn.us/Hexagonal+architecture https://github.com/brettwooldridge/HikariCP/wiki/About-Pool-Sizing

— Chiens
source

Très bonne réponse, mérite d'être lu. Merci d'avoir pris le temps d'écrire cette belle réponse!

— Dominic

6

Si je comprends bien ce qu'est un DBAL , la réponse est qu'une interface REST vous permet d'utiliser n'importe quelle langue pour ses clients, tandis qu'un DBAL est une bibliothèque qui vous permet d'utiliser une seule langue pour ses clients.

Ceci, à son tour, peut être un avantage pour une entreprise où il existe de nombreuses équipes de développement et qui ne maîtrisent pas toutes la même langue. Autoriser leur logiciel à interroger directement la base de données aurait des fonctionnalités équivalentes, mais comme vous le dites "il est préférable d'exposer une API REST limitée que la base de données complète".

En termes plus abstraits, vous répondez vous-même à la question:

C'est donc une couche supplémentaire d'indirection qui ralentit le processus de diagnostic

... puisqu'il existe ce célèbre aphorisme qui dit: "Tous les problèmes de l'informatique peuvent être résolus par un autre niveau d'indirection". :)

— logc
source

6

Ce n'est pas parce que vous êtes dans la même entreprise que vous devez tout exposer à tout le monde. Les API REST permettent de définir une relation client / fournisseur limitée entre les équipes d'une entreprise, avec un contrat clair. Amazon a été un pionnier dans cette forme d'organisation.

Les API fournissent également une couche d'abstraction, vous permettant d'utiliser un ensemble spécifique d'idiomes - vous ne voulez pas nécessairement parler à vos consommateurs dans les mêmes termes que ceux utilisés dans votre base de données. De plus, vous ne voulez pas nécessairement parler à chaque consommateur de la même manière.

— guillaume31
source

3

Vous pensez que REST est destiné aux requêtes de base de données et ce n’est pas le cas. REST représente l'état de quelque chose en ce moment. Utiliser REST change ou récupère une représentation, mais c'est tout. Si cet état devient disponible par base de données, cela n'a pas d'importance et personne ne s'en soucie, car la façon dont cette représentation est créée ne fait pas partie de REST, pas plus que les requêtes de base de données.

— Rob
source

Je ne suggère pas que les requêtes de base de données == REST. REST peut certes être bien plus qu’une couche d’abstraction de base de données, mais au cours des deux dernières entreprises pour lesquelles j’ai travaillé, c’est essentiellement tout ce qu’elle est, une couche d’abstraction de base de données. Il ne fait rien d' autre que traduire les requêtes HTTP en requêtes DB. Et si c'est tout ce que vous faites, il me semble que vous seriez mieux servi par DBAL. En effet, il me semble que la seule raison pour laquelle certaines personnes utilisent REST ces derniers temps est sa tendance, et non parce que c'est la meilleure solution pour la tâche à accomplir.

— neubert

@neubert DBAL fonctionne-t-il directement sur Internet comme le fait REST?

— Rob

Sûr. Vous pouvez indiquer à MySQL d'utiliser une adresse IP / un nom de domaine / un port appartenant à un autre ordinateur sur Internet. Vous pouvez utiliser le tunneling SSH ainsi que (je crois) l’authentification SSL. Vraisemblablement, les autres SGBD fonctionnent de la même manière.

— neubert

@neubert: dans ce cas, l'API REST est un DBAL, n'est-ce pas?

— RemcoGerlich

2

@RemcoGerlich - bien sûr, mais utiliser l'API REST comme base de données DBAL peut ajouter une couche intermédiaire inutile et empêchant le diagnostic des problèmes. Je veux dire, si vous voulez utiliser une définition suffisamment large de DBAL, vous pouvez considérer que les SERP de Google sont des DBAL. Il suffit d’analyser le code HTML pour obtenir les données

— paginées des