Webkällor

Uppdaterad

Webbkällor är kanalen som används för att samla in kunskap från hemsidor som kan användas av våra AI- tjänster. 

Kontakta Kundo för att lägga till nya webbplatser.

Hur man hanterar man webkällor

Kanalen finns i kanalmenyn. 

I varje enskild webbkälla går det att lägga till flera webbplatser. Varje webbplats går också att Pausa/Starta - kan användas för att sluta hämta in nya förändringar.

Firecrawl

Om sidan inte har en sitemap eller sitemapen rapporterar felaktig information, går det även att slå över till "Firecrawl", en annan metod för att hämta in hemsidor. Firecrawl hämtar in max 5000 sidor och uppdateringar sker var 30:e dag, istället för inom 15 minuter så använd sitemap om det är möjligt.  


Blockeringsregler

Det går att blockera specifika sidor eller delar av sajten, så de inte inkluderas i kunskapen. Det kan göras om de innehåller information som man inte vill använda för att svara. Det kan vara gamla pressutskick eller sälj-material som gör att AI svarar olämpligt.

Exakta blockeringar Blockerar en specifik sida.

Börjar med Blockerar alla URLar som börjar med värdet, tex kundo.se/blogg kommer även blockera kundo.se/blogg/när-är-det-dags-att-strukturera-upp-sin-kundservice, kundo.se/blogg/vad-förväntar-sig-kunder-av-kundservice-idag

Regex Blockerar alla URLar som matchar regex-uttrycket, t ex: /admin/.*.*\.pdf$/login|/signup

Ignorera uppdateringar När denna checkbox checkas i fortsätter vi hämta in sidor, men slutar uppdatera dem. Denna funktion finns för att stänga av delar av sitemaps som felaktigt rapporterar uppdateringar.

Använda webkälla i en specifik AI-lösning

För att använda webben som källa i någon kanal behöver den slås på för den specifika kanalen. 

Hur Webbkällor fungerar

Nästan alla sajter har en speciell sida som heter sitemap.xml, där finns en lista på alla enskilda sidor, tex exempel.com/kontakt, exempel.com/blog/artikel1 osv. Det ska också stå när sidan senast uppdaterades.

Var 15.e minut kollar vi sitemap.xml. Om den rapporterar några nya eller uppdaterade sidor laddar vi ner dem. Ber en AI sammanfatta dem och sparar för våra AI-tjänster att använda. Vi tar även bort borttagna sidor.

Användare som har tillgång till kanalen har möjlighet att redigera kanalen och aktivera/avaktivera kanalen i olika AI-tjänster. – Kunskapen är tillgänglig för alla som använder AI-tjänster där kanalen är påslagen. 

Sitemap och SEO

Förutom Kundo använder google och andra sökmotorer sitemaps på samma sätt för att hålla våra kunders sidor uppdaterade. Det betyder att det verkligen ligger i ert intresse att sitemap:en stämmer, är inte bara för att Kundo ska funka bra.

Vad ska man crawla?

Stora volymer crawling  riskerar att förvirra AI-chatten. Det är viktigt att crawla rätt saker. Rätt saker är information som kan tänkas efterfrågas av slutkunder och som är användbar av AI-chatten.  

Riktlinjer:

  • Texter är bra, bilder, scheman och väldigt stora tabeller är dåliga.

  • Undvik gammal information om det finns delar av siten som kan filtreras bort. Så överväg det

  • Använd “Prefix” inställningen i Crawling för att Dölja allt som är dåligt

  • Samma innehåll bör helst bara inkluderas en gång, även om det är skrivet på olika sätt eller på olika språk. Om kunden tex har en e-handel med alla produktbeskrivningar och en separat site för en viss produkt-serie med ungefär samma innehåll räcker det med att crawla e-handeln.

  • Skicka inte in samma innehåll för olika länder i samma AI-chatt. – Kan vara värt att ha om kunden har olika ai-chattar för olika länder. 

warning Warning.