Résumé - Chaine-de-descriptions : Amélioration des LLM de code pour la génération et la résumé de code VHDL

Titre
Chaine-de-descriptions : Amélioration des LLM de code pour la génération et la résumé de code VHDL

Temps
2025-07-16 15:05:30

Auteur
{"Prashanth Vijayaraghavan","Apoorva Nitsure","Charles Mackin","Luyao Shi","Stefano Ambrogio","Arvind Haran","Viresh Paruthi","Ali Elzein","Dan Coops","David Beymer","Tyler Baldwin","Ehsan Degan"}

Catégorie
{cs.CL,cs.AI,cs.AR}

Lien
http://arxiv.org/abs/2507.12308v1

PDF Lien
http://arxiv.org/pdf/2507.12308v1

Résumé

Ce document enquête sur les limites des modèles de langage grandeur (LLM) existants dans la génération et la résumé de code VHDL et propose une approche nouvelle appelée Chaîne-de-Descriptions (CoDes) pour répondre à ces défis. Les auteurs soulignent la popularité croissante des LLM dans divers domaines, y compris la génération et le résumé de code. Cependant, ils notent que la recherche axée sur l'évaluation et l'optimisation des LLM pour les langages de description de matériel (HDL), en particulier VHDL, est limitée. Ce vide entrave l'efficacité des LLM existants pour répondre aux défis uniques de VHDL. Pour remédier à cela, les auteurs évaluent la performance des LLM existants pour la génération et le résumé de code VHDL en utilisant divers indicateurs et deux ensembles de données : VHDL-Eval et VHDL-Xform. Ils constatent que ces modèles sous-Performants de manière cohérente sur différents indicateurs, indiquant un écart significatif dans leur adéquation à ce domaine. Pour répondre à ce défi, les auteurs proposent la stratégie CoDes. CoDes implique la génération d'une série d'étapes intermédiaires descriptives basées sur l'énoncé du problème pour la génération de code et le code VHDL pour le résumé. Ces étapes sont ensuite intégrées avec l'invite d'entrée originale et fournies en entrée à l'LLM pour générer la sortie finale. Les auteurs conduisent des expériences en utilisant divers LLM et montrent que le cadre CoDes améliore considérablement la génération et le résumé de code VHDL. L'introduction d'étapes descriptives intermédiaires améliore la capacité des modèles à générer et résumer le code VHDL. Les auteurs enquêtent également sur l'influence de différentes stratégies d'exécution de plan (exécution unique vs. exécution multiple) sur la performance des LLM dans la génération et le résumé de code. Ils constatent que l'exécution multiphonique outperform de manière cohérente l'approche unique pour les deux tâches. Les auteurs concluent que le cadre CoDes fournit une méthode structurée applicable aux domaines nécessitant des approches de résolution de problèmes détaillées et systématiques. Grâce à cette recherche, ils visent à améliorer les capacités des LLM de code, en les rendant des outils plus efficaces dans l'automatisation de la conception électronique et au-delà. Les contributions clés de cet article incluent : 1. Introduction de l'ensemble de données VHDL-Xform, qui contient des clones de code diversifiés visant à évaluer la compréhension des LLM du code équivalent fonctionnellement. 2. Évaluation sans pré-apprentissage de divers LLM à l'aide à la fois des ensembles de données VHDL-Eval et VHDL-Xform pour la génération et le résumé de code VHDL. 3. Enquête sur la stratégie Chaîne-de-Descriptions (CoDes) pour améliorer la performance des LLM dans la génération et le résumé de code VHDL, établissant un point de référence pour la recherche future dans ce domaine.


Articles Recommandés

États de groupes résilients dans le Mott dans la Nb$_3$Cl$_8$ couchée contre la brisure de symétrie induite par la pression

Piste pour le complexe Du Bois

CRAFT : Cadre génétique basé sur la latence et le coût pour le placement de nœuds dans des environnements Edge-Fog

Structure hyperbolique du pentagone équilatéral

Femtoscopie des systèmes $DN$ et $\bar{D}N$

ThermoRL : Apprentissage par renforcement structurément conscient pour la conception de mutations de protéines pour améliorer la thermorésistance

Réconstruction métrique et hamiltonien pour les binaires excentriques, précessant à la limite de petit rapport de masse

Échantillonnage Monte Carlo multidimensionnel avec intégration parallèle-temps pour la quantification des incertitudes dans la simulation des machines électriques

Dynamique des solitons cavitaires interagissant

U-Net à attention adaptative et résiduelle pour la segmentation de structures courbes dans la microscopie de fluorescence et les images biomédicales