Hur Perplexity AI byggdes på bara sex månader

På Ray Summit 2023, en sammankomst av mjukvaruingenjörer, maskininlärningsutövare, datavetare, utvecklare, MLOps-proffs och arkitekter, delade Aravind Srinivas, grundare och VD för Perplexity AI, resan att bygga den första LLM-drivna responsmotorn på bara sex månader med mindre än 4 miljoner dollar. Toppmötet, känt för sitt fokus på att bygga och distribuera applikationer i stor skala, särskilt inom området för AI och maskininlärning, utgjorde den idealiska plattformen för Srinivas att fördjupa sig i utmaningarna med teknik, resursbegränsningar och framtida möjligheter för Perplexity AI.

Perplexity AI, en revolutionerande forskningsassistent, har skapat en nisch för sig själv genom att ge korrekta och användbara svar, uppbackade av fakta och referenser. Dess konversationsgränssnitt, kontextmedvetenhet och anpassningsmöjligheter gör det till ett unikt verktyg för att söka information online. Målet med Perplexity AI är att få sökupplevelsen att kännas som en kunnig assistent som förstår dina intressen och preferenser och kan förklara saker för dig på ett sätt som fungerar för dig.

Hur Perplexity AI utvecklades

Perplexity AI:s process tillåter användare att ställa frågor på ett naturligt, vardagligt språk, och AI:n arbetar för att förstå avsikten bakom frågan. AI:n arbetar för att förstå avsikten bakom frågan. Hon kan delta i ett fram och tillbaka samtal för att klargöra användarens behov. Den avancerade responsmotorn bearbetar frågor och uppgifter och tar hänsyn till hela konversationshistoriken för sitt sammanhang. Den använder sedan prediktiva textfunktioner för att generera användbara svar, välja det bästa från flera källor och sammanfattar resultaten kortfattat.

Perplexity AI är inte bara en sökmotor som ger direkta svar på användarfrågor; det är mycket mer än så. Till en början fokuserade företaget på text till SQL och företagssökning, med stöd av högprofilerade investerare som Elon Musk, Nat Friedman och Jeff Dean. I november lanserade den en webbsökning efter vänner och Discord-bots, följt av lanseringen av själva Perplexity en vecka senare.

Sedan dess har företaget arbetat outtröttligt för att förbättra sina sökmöjligheter, inklusive förmågan att svara på komplexa frågor som traditionella sökmotorer som Google inte kan hantera. Det lanserade också en "sökassistent"-funktion som kan svara på frågor baserat på uppladdade filer och dokument. För att förbättra användarupplevelsen introducerade Perplexity "Collections", en funktion som låter användare spara och organisera sina sökningar.

När det gäller teknik började Perplexity servera sina egna modeller, inklusive LLMs, och lanserade en förfinad modell som kombinerar hastigheten hos GPT-3.5 med kapaciteten hos GPT-4. Den undersöker också användningen av modeller med öppen källkod och har sin egen anpassade slutledningsstack för att förbättra sökhastigheten.

Tidigare denna månad tillkännagav Perplexity pplx-api, designad för att vara ett av de snabbaste sätten att komma åt Mistral 7B, Llama2 13B, Code Llama 34B, Llama2 70B, replit-code-v1.5-3b . pplx-api tillåter utvecklare att enkelt integrera banbrytande öppen källkod LLM i sina projekt.

  • Enkel att använda: Utvecklare kan använda branschledande, färdiga att använda mallar med öppen källkod och komma igång på några minuter med ett välbekant REST API.

  • Ultrasnabb slutledning: Vårt väldesignade slutledningssystem är effektivt och uppnår upp till 2,9 gånger lägre latens än Replicate and 3,1 gånger lägre latens än Anyscale.

  • Beprövad infrastruktur: pplx-api har bevisad tillförlitlighet och betjänar trafik i produktionsklass både i sin Perplexity-responsmotor och Labs-lekplatsen.

  • En one-stop-shop för LLM:er med öppen källkod: Perplexity-teamet säger att de är dedikerade till att lägga till nya modeller med öppen källkod när de anländer. Till exempel lade teamet till modellerna Llama och Mistral inom några timmar efter lanseringen Utan tidigare tillträde.

I framtiden planerar Perplexity att ytterligare förbättra sina sökmöjligheter och utveckla sina egna modeller för att behålla kontrollen över prissättning och anpassning. Resan av Perplexity AI, som delas av Aravind Srinivas på Ray Summit 2023, är ett bevis på kraften i artificiell intelligens.

Läs mer Guide:

Lämna en kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade *