-
IA générative
L’IA générative est là :
Êtes-vous prêt?L’innovation Intel® intégrée
-
-
-
Par où commencer
Une nouvelle ère d’IA générative
L’IA générative (GenAI) est exploitée à grande échelle par les organisations et les individus, provoquant des retombées sociétales importantes. L’IA grand public, comme ChatGPT et DALL-E, a captivé l’imagination de tous par sa capacité à générer du contenu. Cependant, l’impact de l’IA générative sur les organisations promet encore plus de valeur, y compris une productivité accrue, une réduction des coûts et une transformation de la façon dont nous travaillons.
-
L’IA générative va transformer les organisations.
L’IA générative est porteuse de récompenses, mais elle s’accompagne également de nouveaux défis et risques. Alors que les organisations entament leur parcours en IA générative, elles ne peuvent pas risquer la confiance des clients et la grande valeur de leurs données pour la seule récompense d’être les premiers sur la ligne d’arrivée.
-
-
-
Des données adaptées à votre utilisation
Pour tirer parti efficacement de la puissance de la GenAI, les organisations doivent utiliser des données riches et de haute qualité stratégiquement. Les meilleurs cas d’utilisation reposent sur ces données et nécessitent un mélange équilibré de compétences, de budgets et de ressources, ce qui souligne l’importance de la collaboration entre les équipes commerciales et informatiques pour établir les priorités.
-
-
Création de contenu
-
Recherche en langue naturelle
-
Génération de code
-
Assistant numérique
-
Conception et création de données
-
Automatisation des documents
-
-
-
-
Le succès de l’IA générative
Bien que les entreprises aient découvert des centaines de cas d’utilisation dans tous les domaines, il est essentiel de trouver les bons cas d’utilisation.
-
-
-
Le rôle vital de vos données dans l’IA générative
Les données et les risques vont de pair. Les données feront avancer vos projets d’IA générative, mais vous devez également évaluer les risques liés à l’hébergement de modèles d’IA générative dans des nuages publics, notamment : la perte de propriété intellectuelle, la fuite de données, les problèmes de confidentialité, les violations de la conformité, la perte de crédibilité et d’intégrité, la partialité et la violation de la propriété intellectuelle.
-
-
Gérer les risques et accroître la valeur
Alors que vous entamez votre parcours, il est essentiel d’aligner les investissements dans la technologie et la formation afin de renforcer la maturité opérationnelle, de réduire les risques, d’améliorer le contrôle et de maximiser la valeur pour votre organisation. Avec l’IA générative prête pour l’entreprise, vous gagnez en contrôle sur les personnes qui peuvent accéder à vos données.
-
-
GenAI prête pour l’entreprise GenAI immature Maturité opérationnelle Risque Graphique démontrant que le risque (axe des y) diminue au fil du temps à mesure que vous atteignez la maturité opérationnelle (axe des x) dans le traitement de vos données. Le début de la pente du graphique indique une IA immature présentant un risque élevé et une faible maturité opérationnelle. La tendance à la baisse sur le graphique indique que l’IA prête pour l’entreprise réduit les risques et représente une maturité opérationnelle élevée.
-
-
-
-
-
UTILISEZ L’IA AVEC VOS DONNÉES
Gardez les modèles d’IA génératifs près de vos données
-
-
Comprendre les risques et les avantages des différentes options de déploiement est essentiel pour déterminer le placement optimal des charges de travail de votre organisation pour la GenAI. Lorsqu’il est temps d’amener l’IA à vos données, le déploiement d’instances privées de grands modèles de langage (LLM) de l’IA générative, tels que Llama 2 ou Falcon, offre des avantages en termes de rapidité et de déploiement, il peut également impliquer des coûts plus élevés et d’autres inconvénients. Quoi qu’il en soit, l’IA générative en interne fournira probablement la plus grande valeur pour vos premiers efforts.
En termes de placement de la charge de travail, l’IA générative n’est pas différente de n’importe quelle autre charge de travail. Pour obtenir les meilleurs résultats, placez-le dans l’environnement le plus approprié en fonction des exigences de votre entreprise et de vos besoins techniques.
Le diagramme ci-dessous présente les concepts et les cadres qui entrent en jeu lorsqu’il s’agit de déterminer l’emplacement de la charge de travail de l’IA générative.
-
-
-
-
Où résident les données Coût Rentabilisation plus rapide Précision et personnalisation Cas d’utilisation à usage général Accès sécurisé Nuage public Nuage privé Un graphique représentant six facteurs à prendre en compte lors du choix entre le nuage privé ou le nuage public pour le placement des charges de travail GenAI. « Là où résident les données » et « Accès sécurisé » penchent fortement en faveur du nuage privé. Le « coût » penche modérément vers le nuage privé et la « précision et la personnalisation » penchent légèrement vers le nuage privé. « Rentabilisation plus rapide » penche légèrement du côté du nuage public. Et les « cas d’utilisation à usage général » penchent fortement vers le nuage public.
-
-
Gestion des données pour l’IA générative
La plupart des organisations adoptent une approche à deux volets pour leur stratégie d’IA générative. Elles expérimentent des déploiements tactiques pour apprendre et éviter de prendre du retard, tout en développant une stratégie à long terme pour prendre en compte les nombreux cas d’utilisation qui émergeront au fil du temps. Cette approche nécessite une stratégie de gestion des données à deux niveaux.
PRÉPARATION DES DONNÉESINGÉNIERIE DES DONNÉES -
-
-
Préparation des données
-
À court terme : préparation des données
La préparation des données comprend l’identification des ensembles de données et la définition des exigences en matière de données, suivies du nettoyage, de l’étiquetage et de l’anonymisation des données, puis de leur normalisation entre les sources de données. Il faut également créer des pipelines de données pour intégrer les données dans un modèle.
-
-
-
Ingénierie des données
-
À long terme : ingénierie des données
Les organisations ont besoin d’un référentiel de données bien structuré, tel qu’un lac de données (ou un data lakehouse), pour intégrer leurs données aux modèles de l’IA générative. Envisager de constituer le lac de données de manière itérative afin d’étendre progressivement les capacités du référentiel de données de l’IA générative pendant que l’équipe améliore ses compétences en matière de gestion des données et d’IA générative.
-
-
-
-
-
-
« Cette collaboration [avec Dell Technologies] permettra aux entreprises de créer leurs propres systèmes d’IA en tirant parti de l’incroyable innovation de la communauté du code source libre, tout en bénéficiant de la sécurité, de la conformité et des performances des systèmes Dell. »
-
-
-
-
-
-
L’IA À SA JUSTE MESURE
Définir l’infrastructure et l’IA qu’il vous faut
-
Vos données uniques vous permettent de recourir à des cas d’utilisation spécifiques au domaine et à l’entreprise, en créant de la valeur industrielle par le biais de tâches ou de fonctions pour lesquelles vous avez la propriété exclusive des données. Les différents types d’IA générative ont des points d’entrée correspondants et des investissements nécessaires pour garantir le succès. Les LLM formés sur de grandes quantités de texte sont comme des encyclopédies, utiles pour un usage général, mais qui peuvent ne pas convenir pour répondre à des questions spécifiques concernant vos données organisationnelles.
-
-
-
Vos données améliorent considérablement l’efficacité et la valeur de l’IA générative.
-
Fonctionnalité limitée Plus petit/plus rentable Expertise du domaine Plus précis Plus petite taille Encore plus précis Plus d’hallucinations Coûteux et énergivore Diversité des cas d’utilisation Usage général Propre à l’entreprise Spécifique au domaine Grands modèles de langage Valeur Graphique montrant les quantités relatives de données requises pour trois types de modèles d’IA, ainsi que leur valeur commerciale. Les grands modèles de langage, ou LLM, sont destinés à des cas d’utilisation à usage général et utilisent le plus de données. Ils peuvent être coûteux et énergivores et ils sont plus sujets aux hallucinations. L’IA spécifique au domaine utilise moins de données, mais elles sont plus précises. Elle a des fonctionnalités limitées, mais elle est plus pertinente pour votre entreprise et a plus de valeur. L’IA spécifique à l’entreprise utilise encore moins de données, mais elle est la plus précise, et offre la plus grande valeur à votre entreprise.
-
-
-
Modèles de déploiement de l’IA : Évaluer les compromis en termes de coûts et de valeur
Les trois premiers types de modèles de déploiement présentés ci-dessous sont ceux que la plupart des organisations mettent actuellement en œuvre, en commençant par l’« augmentation du modèle », puis en décidant finalement d’« affiner les modèles ». Le modèle d’IA que vous choisirez dépendra du niveau de préparation de votre organisation en matière de science des données, des modèles de déploiement et des implications de chacun.
-
Modèle préentraîné
Appelée la « rédactique », cette approche consiste à poser une question à un modèle préentraîné et à recevoir une réponse.
Exemple : ChatGPTAugmentation du modèle
Améliorez votre modèle d’IA générative en ajoutant vos données pour fournir un contexte supplémentaire à ses réponses, comme l’inférence, qui comprend des cas d’utilisation tels que la génération augmentée par récupération (RAG).
Affinement des modèles
Il s’agit d’ajuster la pondération du modèle et d’intégrer vos données. Bien que cette approche permette d’obtenir de meilleurs résultats, cela demande également plus d’efforts lors de la mise en place.
Entraînement des modèles
Cette approche consiste à élaborer un modèle spécifique et à l’entraîner à l’aide d’un ensemble de données. Cela nécessite généralement le plus de travail et de ressources et est souvent réservé à la résolution de problèmes complexes.
Effort Coût Valeur et
différenciationIntégration des données Infrastructure Client – serveur Client – serveur Processeur graphique optimisé Déploiement d’un processeur graphique à grande échelle Compétences Opérations informatiques Développeur Expert en sciences des données Expert en sciences des données Référence de déploiement simplifiée
-
Choisissez la bonne infrastructure pour votre modèle
L’infrastructure soutenant votre déploiement d’IA générative dépend largement des exigences de calcul, influencées par le type de modèle, la taille du modèle et le nombre d’utilisateurs. D’autres considérations incluent la capacité de stockage nécessaire pour les données utilisées lors du déploiement, de la formation et de l’affinement du modèle.
-
CALCUL GÉNÉRAL (Axé sur les processeurs) OPTIMISÉ POUR L’IA (Processeurs graphiques intensifs) Ordinateurs portables Dell Postes de travail Precision Serveurs PowerEdge montés sur bâtis Serveur PowerEdge XE Stockage ObjectScale Stockage PowerScale Stockage PowerFlex Commutateurs PowerSwitch série Z Entraînement des modèles Affinement des modèles Augmentation du modèle Modèle préentraîné Millions de paramètres Milliards de paramètres Trillions de paramètres Nombre d’utilisateurs faible Nombre d’utilisateurs élevé Un graphique représentant trois exigences de GenAI et mise en correspondance des solutions matérielles Dell appropriées. La puissance des solutions matérielles va des options de calcul général, qui sont axées sur le processeur, aux options optimisées pour l’IA, qui sont gourmandes en ressources graphiques. Les options spécifiques commencent par les ordinateurs portables Dell pour le calcul général, et progressent à travers les postes de travail Precision et les serveurs PowerEdge, pour se terminer avec les serveurs PowerEdge XE du côté des solutions optimisées pour l’IA. Veuillez noter que le matériel de stockage et de réseautage Dell peut être utilisé sur l’ensemble de la gamme. Trois attributs de l’infrastructure GenAI sont associés à ces solutions dans une progression qui nécessite de plus en plus de puissance de traitement. La complexité du modèle peut aller de l’utilisation de modèles préentraînés et de l’augmentation ou de l’affinement des modèles à l’entraînement de nouveaux modèles. Le nombre de paramètres peut aller de millions à des milliards, jusqu’à des trillions.
-
-
-
-
-
Accélérez votre parcours en IA
Commencer par une victoire rapide
La génération augmentée par récupération (RAG) est un cas d’utilisation précoce idéal pour de nombreuses organisations qui exploitent des ressources supplémentaires, telles que leurs propres données, pour augmenter un modèle sans le réentraîner. Explorez les cas d’utilisation de RAG qui peuvent être appliqués pour améliorer votre entreprise et vos données.
-
Cas d’utilisation de la RAG
Appliquer la RAG à un jeu de données PDF personnalisé
-
CONCEPTION POUR LA RAG VALIDÉE PAR DELL
Déployez un assistant numérique sur Dell APEX Cloud Platform for Red Hat OpenShift
-
-
Laissez-nous vous aider à accélérer votre parcours
Dell peut vous aider à éliminer les obstacles et à permettre l’adoption de l’IA générative à l’échelle de l’entreprise grâce à une approche holistique de bout en bout, du bureau au centre de données.
-