Kuidas kasutada Pydantic (JSON) parserit LangChainis?

Kuidas Kasutada Pydantic Json Parserit Langchainis



Tehisintellekt on üks kiiremini kasvavaid tehnoloogiaid, mis kasutavad masinaõppe algoritme, et treenida ja testida mudeleid, kasutades tohutuid andmeid. Andmeid saab salvestada erinevates vormingutes, kuid LangChaini abil suurte keelemudelite tegemiseks on enimkasutatav tüüp JSON. Koolitus- ja testimisandmed peavad olema selged ja täielikud ilma ühemõttelisuseta, et mudel saaks tõhusalt toimida.

See juhend näitab pydantilise JSON-parseri kasutamise protsessi LangChainis.







Kuidas kasutada Pydantic (JSON) parserit LangChainis?

JSON-andmed sisaldavad andmete tekstivormingut, mida saab koguda veebikraapimise ja paljude muude allikate, näiteks logide jms kaudu. Andmete täpsuse kinnitamiseks kasutab LangChain protsessi lihtsustamiseks Pythoni püdantilist teeki. Püdantilise JSON-parseri kasutamiseks LangChainis lugege lihtsalt läbi see juhend:



1. samm: installige moodulid



Protsessi alustamiseks installige lihtsalt LangChaini moodul, et kasutada selle teeke LangChainis parseri kasutamiseks:





pip installida langchain



Nüüd kasutage ' pip install ” käsk OpenAI raamistiku hankimiseks ja selle ressursside kasutamiseks:

pip installida openai

Pärast moodulite installimist looge lihtsalt ühendus OpenAI keskkonnaga, sisestades selle API võtme, kasutades nuppu ' sina ” ja „ saada pass ” raamatukogud:

importida meid
impordi getpass

os.environ [ „OPENAI_API_KEY” ] = getpass.getpass ( 'OpenAI API võti:' )

2. samm: importige teegid

Kasutage LangChaini moodulit vajalike teekide importimiseks, mida saab kasutada viipa malli loomiseks. Viipa mall kirjeldab loomulikus keeles küsimuste esitamise meetodit, et mudel saaks viipast tõhusalt aru. Samuti importige teeke, nagu OpenAI ja ChatOpenAI, et luua vestlusroboti loomiseks LLM-e kasutades kette:

langchain.prompts impordist (
PromptMall,
ChatPromptTemplate,
HumanMessagePromptTemplate,
)
langchain.llms-ist importige OpenAI
langchain.chat_models impordib ChatOpenAI-d

Pärast seda importige pydantilised teegid, nagu BaseModel, Field ja validator, et kasutada LangChainis JSON-i parserit:

langchain.output_parsers impordib PydanticOutputParseri
pydantic impordist BaseModel, Field, validator
impordiloendi tippimisest

3. samm: mudeli loomine

Pärast kõigi pydantilise JSON-i parseri kasutamiseks vajalike teekide hankimist hankige lihtsalt OpenAI() meetodiga eelnevalt kavandatud testitud mudel:

mudeli_nimi = 'text-davinci-003'
temperatuur = 0,0
mudel = OpenAI ( mudeli nimi =mudeli_nimi, temperatuuri = temperatuur )

4. samm: konfigureerige Actor BaseModel

Ehitage teine ​​mudel, et saada näitlejatega seotud vastuseid, näiteks nende nimesid ja filme, küsides näitleja filmograafiat:

klassi näitleja ( Põhimudel ) :
nimi: str = väli ( kirjeldus = 'Peaosatäitja nimi' )
filmi_nimed: nimekiri [ str ] = Väli ( kirjeldus = 'Filmid, milles näitleja oli peaosas' )


näitleja_päring = 'Ma tahan näha iga näitleja filmograafiat'

parser = PydanticOutputParser ( püdantiline_objekt = Näitleja )

prompt = PromptMall (
malli = 'Vasta kasutaja viipale. \n {format_instructions} \n {päring} \n ' ,
sisend_muutujad = [ 'päring' ] ,
osalised_muutujad = { 'format_juhised' : parser.get_format_instructions ( ) } ,
)

5. samm: baasmudeli testimine

Lihtsalt hankige väljund, kasutades funktsiooni parse() koos väljundmuutujaga, mis sisaldab viipa jaoks genereeritud tulemusi:

_input = prompt.format_prompt ( päring =näitleja_päring )
väljund = mudel ( _input.to_string ( ) )
parser.parse ( väljund )

Näitleja nimega ' Tom Hanks ” koos tema filmide loendiga on toodud mudelist püdantilise funktsiooni abil:

See kõik puudutab pydantilise JSON-parseri kasutamist LangChainis.

Järeldus

Püdantilise JSON-parseri kasutamiseks LangChainis installige lihtsalt LangChaini ja OpenAI moodulid, et luua ühendus nende ressursside ja teekidega. Pärast seda importige teeke, nagu OpenAI ja pydantic, et luua baasmudel ja kontrollida andmeid JSON-vormingus. Pärast baasmudeli koostamist käivitage funktsioon parse() ja see tagastab viipa vastused. See postitus demonstreeris pydantilise JSON-parseri kasutamise protsessi LangChainis.