Che cos’è la “Prompt Engineering” e come funziona?
Che cos'è la "Prompt Engineering" e come funziona?
Scritto da Alice Ivey tramite CoinTelegraph.com,
Esplora il concetto di ingegneria rapida, il suo significato e come funziona nella messa a punto dei modelli linguistici…
Il prompt engineering è diventato un metodo potente per ottimizzare i modelli linguistici nell'elaborazione del linguaggio naturale (NLP) . Implica la creazione di suggerimenti efficienti, spesso indicati come istruzioni o domande, per dirigere il comportamento e l'output dei modelli di intelligenza artificiale.
Grazie alla capacità dell'ingegneria rapida di migliorare la funzionalità e la gestione dei modelli linguistici, ha attirato molta attenzione. Questo articolo approfondirà il concetto di ingegneria rapida, il suo significato e come funziona.
Comprensione dell'ingegneria rapida
La progettazione rapida comporta la creazione di domande o istruzioni precise e informative che consentono agli utenti di acquisire gli output desiderati dai modelli di intelligenza artificiale.
Questi prompt fungono da input precisi che dirigono il comportamento di modellazione del linguaggio e la generazione del testo.
Gli utenti possono modificare e controllare l'output dei modelli AI strutturando attentamente i prompt, il che ne aumenta l'utilità e l'affidabilità.
Storia dell'ingegneria rapida
In risposta alla complessità e alle capacità in espansione dei modelli linguistici, l'ingegneria dei prompt è cambiata nel tempo. Sebbene l'ingegneria rapida possa non avere una lunga storia, le sue basi possono essere viste nelle prime ricerche sulla PNL e nella creazione di modelli di linguaggio AI. Ecco una breve panoramica della storia dell'ingegneria rapida:
Era pre-trasformatore (prima del 2017)
L'ingegneria rapida era meno comune prima dello sviluppo di modelli basati su trasformatore come il trasformatore generativo pre-addestrato (GPT) di OpenAI . La conoscenza contestuale e l'adattabilità mancano nei modelli linguistici precedenti come le reti neurali ricorrenti (RNN) e le reti neurali convoluzionali (CNN) , il che limita il potenziale per l'ingegneria rapida.
Pre-formazione e l'emergere di trasformatori (2017)
L'introduzione dei trasformatori, in particolare con il documento "Attention Is All You Need" di Vaswani et al. nel 2017, ha rivoluzionato il campo della PNL. I trasformatori hanno reso possibile pre-addestrare i modelli linguistici su vasta scala e insegnare loro come rappresentare parole e frasi nel contesto. Tuttavia, per tutto questo tempo, l'ingegneria rapida era ancora una tecnica relativamente inesplorata.
Ottimizzazione e ascesa del GPT (2018)
Un importante punto di svolta per l'ingegneria rapida si è verificato con l'introduzione dei modelli GPT di OpenAI. I modelli GPT hanno dimostrato l' efficacia della pre-formazione e della messa a punto su particolari compiti a valle. Per una varietà di scopi, ricercatori e professionisti hanno iniziato a utilizzare tecniche di ingegneria rapida per dirigere il comportamento e l'output dei modelli GPT.
Progressi nelle tecniche di ingegneria rapida (2018-oggi)
Man mano che la comprensione dell'ingegneria rapida cresceva, i ricercatori iniziarono a sperimentare diversi approcci e strategie. Ciò includeva la progettazione di prompt ricchi di contesto, l'utilizzo di modelli basati su regole, l'incorporazione di istruzioni di sistema o per l'utente e l'esplorazione di tecniche come l'ottimizzazione dei prefissi. L'obiettivo era migliorare il controllo, mitigare i pregiudizi e migliorare le prestazioni complessive dei modelli linguistici.
Contributi ed esplorazione della comunità (2018-oggi)
Man mano che l'ingegneria rapida guadagnava popolarità tra gli esperti di PNL, accademici e programmatori hanno iniziato a scambiarsi idee, lezioni apprese e migliori pratiche. I forum di discussione online, le pubblicazioni accademiche e le biblioteche open source hanno contribuito in modo significativo allo sviluppo di metodi di ingegneria rapida.
Ricerca in corso e direzioni future (presente e oltre)
L'ingegneria rapida continua ad essere un'area attiva di ricerca e sviluppo. I ricercatori stanno esplorando modi per rendere l'ingegneria rapida più efficace, interpretabile e di facile utilizzo. Si stanno studiando tecniche come ricompense basate su regole, modelli di ricompensa e approcci umani nel ciclo per perfezionare le strategie di ingegneria rapida.
Significato dell'ingegneria rapida
L'ingegnerizzazione rapida è essenziale per migliorare l'usabilità e l'interpretabilità dei sistemi di intelligenza artificiale. Ha una serie di vantaggi, tra cui:
Controllo migliorato
Gli utenti possono dirigere il modello linguistico per generare le risposte desiderate fornendo istruzioni chiare tramite prompt. Questo grado di supervisione può aiutare a garantire che i modelli di intelligenza artificiale forniscano risultati conformi a standard o requisiti predeterminati.
Ridurre i pregiudizi nei sistemi di intelligenza artificiale
L'ingegneria rapida può essere utilizzata come strumento per ridurre i pregiudizi nei sistemi di intelligenza artificiale . I pregiudizi nel testo generato possono essere trovati e ridotti progettando attentamente i prompt, portando a risultati più giusti e uguali.
Modifica del comportamento del modello
I modelli linguistici possono essere modificati per visualizzare i comportamenti desiderati utilizzando il prompt engineering. Di conseguenza, i sistemi di intelligenza artificiale possono diventare esperti in particolari attività o domini, il che ne migliora l'accuratezza e l'affidabilità in particolari casi d'uso.
Come funziona l'ingegneria tempestiva
Il prompt engineering utilizza un processo metodico per creare potenti prompt. Ecco alcune azioni cruciali:
Specificare l'attività
Stabilisci lo scopo o l'obiettivo preciso che vuoi che il modello linguistico raggiunga. Può essere coinvolta qualsiasi attività di PNL , incluso il completamento del testo, la traduzione e il riepilogo.
Identificare gli input e gli output
Definisci chiaramente gli input richiesti dal modello linguistico e gli output desiderati che ti aspetti dal sistema.
Creare prompt informativi
Creare prompt che comunichino chiaramente il comportamento previsto al modello. Queste domande dovrebbero essere chiare, brevi e appropriate per lo scopo dato. Trovare i migliori prompt può richiedere tentativi ed errori e revisioni.
Iterare e valutare
Metti alla prova i prompt creati inserendoli nel modello linguistico e valutando i risultati. Esamina i risultati, cerca i difetti e modifica le istruzioni per migliorare le prestazioni.
Calibrazione e messa a punto
Tenere conto dei risultati della valutazione durante la calibrazione e la messa a punto dei prompt. Questa procedura comporta l'esecuzione di piccoli aggiustamenti per ottenere il comportamento del modello richiesto, assicurando che sia allineato con il lavoro e i requisiti previsti.
Tyler Durden Dom, 07/09/2023 – 13:30
Questa è la traduzione automatica di un articolo pubblicato su ZeroHedge all’URL https://www.zerohedge.com/technology/what-prompt-engineering-and-how-does-it-work in data Sun, 09 Jul 2023 17:30:00 +0000.