Déanann samhail nua Zephyr-7B LLM AI scagadh ar Mistral-7B agus buaileann sé Llama-2 70B

Tá cloch mhíle shuntasach eile feicthe ag saol na hintleachta saorga nuair a scaoileadh múnla nua hintleachta saorga Zephyr-7B ar Hugging Face. Tá an tsamhail nuálaíoch seo ina chomharba scagtha ar an tsamhail bhunaidh Mistral 7B, agus d’éirigh léi sárobair a dhéanamh ar mhúnlaí níos mó faoi 70 billiún paraiméadair, fiú nuair nach ndearnadh cinsireacht air. Nocht an chuideachta freisin tuarascáil theicniúil chuimsitheach, ag tabhairt forbhreathnú mionsonraithe ar an bpróiseas oiliúna samhail. Bain triail as an Zephyr 7B Beta nua anseo.

Optamú Rogha Díreach (DPO)

Cuireadh oiliúint ar mhúnla Zephyr-7B ag baint úsáide as straitéis trí chéim. Is é an chéad chéim ná mionchoigeartú driogtha maoirsithe a dhéanamh ag baint úsáide as tacar sonraí Ultra Chat. Chuaigh an tacar sonraí seo, lena n-áirítear 1,47 milliún dialóg iolrach ginte ag GPT 3.5 Turbo, trí dhianphróiseas glantacháin agus scagtha, rud a d'fhág nach raibh ach 200 sampla ann. Is éard atá i gceist leis an bpróiseas coigeartaithe maoirsithe driogtha ná múnla dinimic múinteoir-mac léinn, le múnla níos mó cosúil le GPT 000 ag imirt ról an mhúinteora agus Zephyr-3.5B i ról an dalta. Gineann múnla an mhúinteora comhrá pras-bhunaithe, a úsáidtear ansin chun múnla an dalta, Zephyr-7B a bheachtú.

Zephyr-7B in aghaidh Lama-2 70B

Is é an dara céim sa straitéis oiliúna aiseolas AI. Úsáideann an chéim seo an tacar sonraí Ultra Feedback, comhdhéanta de 64 teachtaireacht éagsúil. Gineann ceithre mhúnla éagsúla freagraí ar gach teachtaireacht, a ndéanann GP000 measúnú orthu ansin bunaithe ar a macántacht agus a n-úsáidí. Cuidíonn an próiseas seo le freagraí na samhla a bheachtú, ag cur lena fheidhmíocht iomlán dá réir.

Is í an chéim dheireanach den straitéis oiliúna múnla eile a oiliúint ag baint úsáide as an tacar sonraí cruthaithe le buaiteoir agus fear caillte na himeartha. Neartaíonn an chéim seo oiliúint an tsamhail Zephyr-7B, ag cinntiú gur féidir leis freagraí iontaofa ardchaighdeáin a ghiniúint.

Bhí feidhmíocht an tsamhail Zephyr-7B go hiontach, ag déanamh níos fearr ná na samhlacha 7 billiún eile go léir agus samhlacha fiú níos mó cosúil leis na samhlacha Falcon 40 billiún agus Llama 2 70 billiún. Mar sin féin, tá sé tábhachtach a thabhairt faoi deara go n-athraíonn feidhmíocht na samhla ag brath ar an tasc sonrach. Mar shampla, déanann sé níos measa ar thascanna cosúil le códú agus matamaitic. Ba cheart d’úsáideoirí, dá bhrí sin, samhail a roghnú bunaithe ar a gcuid riachtanas sainiúil, toisc go mb’fhéidir nach mbeadh an tsamhail Zephyr-7B is fearr a oireann do gach tasc.

Zephyr-7B LLM

Gné uathúil den tsamhail Zephyr-7B ná a nádúr gan cinsireacht. Cé go bhfuil sé uncensored go pointe áirithe, tá sé deartha chun comhairle a thabhairt i gcoinne gníomhaíochtaí mídhleathacha nuair a spreagtar é, ag cinntiú go leantar treoirlínte eiticiúla ina chuid freagraí. Tá an ghné seo ríthábhachtach chun sláine agus úsáid fhreagrach an mhúnla a chothabháil.

Is féidir an tsamhail Zephyr-7B a reáchtáil go háitiúil ag baint úsáide as LMStudio nó comhéadan gréasáin giniúna téacs UABA. Ligeann sé seo d’úsáideoirí an teimpléad a úsáid sa timpeallacht dá rogha féin, ag feabhsú a inrochtaineachta agus éasca le húsáid.

Tá an tsamhail Zephyr-7B ina theannta sin tábhachtach leis an tírdhreach AI. Leagann a straitéis oiliúna uathúil, feidhmíocht shuntasach, agus nádúr uncensored amach é ó shamhlacha eile. Mar sin féin, athraíonn a fheidhmíocht ag brath ar an tasc atá ar láimh, agus dá bhrí sin ba chóir d'úsáideoirí a roghnú an tsamhail is fearr a fhreastalaíonn ar a gcuid riachtanas ar leith. Soláthraíonn freastalaí gníomhach Discord na cuideachta ardán le haghaidh díospóireachtaí giniúna a bhaineann le AI, rud a chothaíonn pobal foghlama agus fáis. De réir mar a leanann an réimse AI ag forbairt, beidh sé spreagúil a fheiceáil cad a thugann samhlacha cosúil le Zephyr-7B amach anseo.

Léigh tuilleadh Treoir:

Clibeanna:

Leave a comment

Ní fhoilseofar do sheoladh ríomhphoist. Réimsí riachtanacha atá marcáilte *