MedQA : Fine-tuning d'une IA médicale sur AMD ROCm
MedQA est un modèle de réponse aux questions médicales fine-tuné avec LoRA sur du matériel AMD MI300X, sans dépendance CUDA. Il utilise Qwen3-1.7B et le dataset MedMCQA pour fournir des réponses cliniques précises.
Points clés
- MedQA utilise le modèle Qwen3-1.7B fine-tuné avec LoRA sur AMD MI300X.
- Le modèle a été entraîné sur 2 000 échantillons de MedMCQA en 5 minutes.
- AMD MI300X dispose de 192 Go de mémoire HBM3, permettant un entraînement en fp16 sans quantification.
- Seulement 2,2 millions de paramètres sur 1,5 milliard sont entraînés avec LoRA.
Pourquoi c'est important
MedQA démontre qu'il est possible de fine-tuner un modèle IA médical efficace sans dépendre de CUDA, ouvrant des possibilités pour les utilisateurs de matériel AMD. Cela réduit les coûts et augmente l'accessibilité des technologies IA en santé.
Public concerné : développeurs, entreprises
Comment MedQA fonctionne-t-il sans CUDA ?
MedQA utilise ROCm d'AMD pour fine-tuner le modèle Qwen3-1.7B avec LoRA, sans nécessiter de dépendance CUDA, grâce à des variables d'environnement spécifiques.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !