
Generatiivinen AI asiakaspalvelussa on hyödyllinen vasta, kun se saa tehdä muutakin kuin kuulostaa fiksulta. LLM eli suuri kielimalli voi ymmärtää asiakkaan kysymyksen, muotoilla vastauksen, tiivistää puhelun ja käyttää työkaluja. Se voi myös keksiä varman kuuloisen vastauksen väärästä asiasta. Molemmat puolet pitää hyväksyä ennen käyttöönottoa.
Puhelimessa generatiivinen AI on erityisen kiinnostava, koska keskustelu etenee reaaliajassa. Asiakas ei kirjoita täydellistä tikettiä. Hän puhuu, korjaa itseään, ärsyyntyy, kysyy sivukysymyksen ja odottaa vastausta heti. LLM sopii tähän paremmin kuin vanha avainsanapohjainen botti. Mutta se tarvitsee rajat.
Tässä oppaassa käydään läpi, miten LLM:t toimivat puhelinasiakaspalvelussa, missä niistä on hyötyä ja mitä yrityksen pitää suunnitella ennen tuotantoa. Lyhyt versio: malli ei ole palvelu. Palvelu syntyy mallin, tiedon, integraatioiden ja valvonnan yhdistelmästä.

Mitä LLM tekee puhelun aikana?
Puhelinpalvelussa LLM voi olla mukana useassa kohdassa. Se ei välttämättä puhu asiakkaalle suoraan koko ajan. Se voi myös toimia taustalla avustajana.
Tyypillisiä tehtäviä ovat:
- puheen tekstiksi muuttuneen sisällön tulkinta
- asiakkaan intentin tunnistaminen
- vastauksen muodostaminen hyväksytystä tietopohjasta
- tarkentavien kysymysten ehdottaminen
- puhelun yhteenvedon kirjoittaminen
- CRM- tai tikettimerkinnän muotoilu
- seuraavan toimenpiteen ehdottaminen
- ihmiseen siirron syyn tunnistaminen
Puhe-AI:ssa LLM on usein keskustelun aivot, mutta sen ympärillä on muitakin osia: puheentunnistus, puhesynteesi, puhelureititys, integraatiot, lokitus ja käyttöliittymä ihmiselle. Jos jokin näistä pettää, hyväkään malli ei pelasta kokemusta.
Älä anna mallin vastata muistista
Suurin virhe on antaa generatiivisen AI:n vastata yrityksen asiakkaille yleisen mallimuistin perusteella. Malli voi tietää paljon maailmasta, mutta se ei tiedä yrityksen tämän päivän toimitusehtoja, hinnastoa, kampanjoita, asiakaskohtaista sopimusta tai sisäistä prosessia, ellei sitä anneta sille oikein.
Hyvä toteutus käyttää hyväksyttyä tietopohjaa. Tätä kutsutaan usein RAG-malliksi: AI hakee relevantin tiedon dokumenteista, tietokannasta tai järjestelmästä ja vastaa sen perusteella. Puhelussa tämä voi tarkoittaa esimerkiksi:
- palveluohjeiden hakemista tietopankista
- ajanvarauskalenterin lukemista
- tilauksen tilan tarkistamista verkkokaupan järjestelmästä
- asiakkaan sopimustietojen hakemista CRM:stä
- tuotteen saatavuuden tarkistamista
Jos tietoa ei löydy, AI:n pitää sanoa se tai siirtää asia ihmiselle. Se kuulostaa pieneltä säännöltä. Se on käytännössä yksi tärkeimmistä.

Reaaliaikainen puhelu vaatii nopeutta
Sähköpostissa AI voi miettiä muutaman sekunnin. Puhelussa hiljaisuus tuntuu pitkältä nopeasti. Jos jokainen vastaus vaatii usean järjestelmähaun ja pitkän mallipäättelyn, keskustelu alkaa nykiä.
Siksi puhe-AI:ssa suunnitellaan latenssi eli viive. Mitkä vastaukset voidaan antaa heti? Mitkä tiedot haetaan taustalla? Milloin AI sanoo asiakkaalle, että tarkistan hetken? Milloin asia siirretään ihmiselle, jos järjestelmä ei vastaa?
Hyvä keskustelurytmi on usein tärkeämpi kuin täydellinen tekninen eleganssi. Asiakas antaa anteeksi lyhyen tarkistushetken, jos se tuntuu luontevalta. Hän ei anna anteeksi kahdeksan sekunnin hiljaisuutta, jonka jälkeen AI vastaa väärään kysymykseen. Kummallista kyllä.
Haluatko tietää, miten tämä toimisi sinun yrityksessäsi?
Ilmainen 30 minuutin kartoitus — ei sitoumuksia.
Varaa kartoitusGuardrailit ovat tuotannon perusasia
Generatiivinen AI tarvitsee ohjeet siitä, mitä se saa tehdä ja mitä ei. Näitä rajoja kutsutaan usein guardraileiksi. Sana on vähän kulunut, mutta asia on todellinen.
Puhelinpalvelussa kannattaa rajata ainakin:
- sallitut käyttötapaukset
- kielletyt aiheet ja päätökset
- milloin AI saa hakea henkilötietoja
- milloin AI saa kirjoittaa järjestelmään
- milloin tarvitaan asiakkaan vahvistus
- milloin puhelu siirretään ihmiselle
- mitä AI sanoo, jos se ei tiedä
Esimerkiksi reklamaatiopuhelussa AI voi kerätä tiedot ja luoda tiketin. Se ei välttämättä saa luvata hyvitystä. Terveydenhuollossa AI voi siirtää ajan. Se ei saa tehdä hoidon tarpeen arviota ilman erillistä hyväksyttyä prosessia. Rahoituksessa AI voi kertoa yleisen dokumenttilistan. Se ei saa antaa yksilöllistä sijoitusneuvontaa.
Rajat kannattaa testata ilkeillä kysymyksillä. Asiakkaat eivät noudata demo-skriptiä. He kysyvät mitä kysyvät, yleensä juuri siinä muodossa, jota kukaan ei suunnitellut.
Työkalujen käyttö tekee LLM:stä hyödyllisen
LLM:n todellinen arvo asiakaspalvelussa syntyy, kun se käyttää työkaluja. Työkalu voi olla API-kutsu, haku tietokannasta, ajanvarauksen tekeminen, tiketin luonti tai viestin lähettäminen. Ilman työkaluja AI jää helposti kohteliaaksi tiedonvälittäjäksi.
Puhelussa työkalujen käyttö pitää tehdä varovasti:
1. AI ymmärtää asiakkaan pyynnön. 2. AI tarkistaa, kuuluuko pyyntö sallittuihin tehtäviin. 3. AI kysyy puuttuvat tiedot. 4. AI pyytää asiakkaalta vahvistuksen, jos toimi muuttaa jotain. 5. AI tekee työkalukutsun. 6. AI kertoo lopputuloksen ja kirjaa tapahtuman.
Tämä rakenne estää monta virhettä. Jos asiakas sanoo ehkä siirretään aika ensi viikolle, AI ei saa heti muuttaa varausta. Sen pitää varmistaa päivä, kellonaika ja suostumus. Perusasia ihmiselle. Mallille se pitää silti kirjoittaa auki.

Suomen kieli ja asiakaskokemus
Suomenkielinen puhe-AI ei saa kuulostaa käännökseltä, joka on käynyt PowerPoint-kylvyssä. Asiakaspalvelussa sävy ratkaisee paljon. AI:n pitää ymmärtää puhekieltä, murteita, epätäydellisiä lauseita ja sitä, että suomalainen asiakas voi sanoa ei tässä nyt mitään mutta tarkoittaa, että asia on palamassa.
LLM auttaa tässä, koska se ymmärtää vapaampaa kieltä paremmin kuin vanhat intenttimallit. Silti puheentunnistus, sanasto ja yrityksen oma terminologia pitää testata. Tuotenimet, paikkakunnat, henkilönnimet ja lyhenteet menevät helposti väärin.
Hyvä käytäntö on kerätä testipuheluita eri puhujilta ja eri tilanteista. Ei vain täydellistä studiosuomea. Jos palvelu toimii vain rauhallisella demopuheella, se ei ole valmis puhelinpalveluun.
Lokitus ja laadunvalvonta
Generatiivisen AI:n kanssa pitää pystyä selvittämään, miksi jokin vastaus syntyi. Puhelun jälkeen kannattaa nähdä ainakin:
- mitä käyttötapausta AI hoiti
- mitä tietolähteitä se käytti
- mitä työkaluja se kutsui
- mitä asiakkaalta vahvistettiin
- siirrettiinkö puhelu ihmiselle ja miksi
- mikä AI-ohjeistuksen versio oli käytössä
- mikä yhteenveto tallennettiin
Tämä ei tarkoita, että kaikki promptit ja transkriptiot dumpataan lokiin. Päinvastoin. Lokitus pitää suunnitella niin, että se auttaa selvittämään virheitä ilman että se vuotaa henkilötietoja. Aiheesta lisää artikkelissa Lokitus ja jäljitettävyys AI-puheluissa.
Miten käyttöönotto kannattaa aloittaa?
Hyvä ensimmäinen LLM-pohjainen puhelinpalvelu on rajattu. Valitse prosessi, jossa on selkeät säännöt, vähän poikkeuksia ja riittävä volyymi. Ajanvaraus, takaisinsoittopyyntö, tilaustilanne tai FAQ ovat usein hyviä alkuja.
Käyttöönoton järjestys:
1. Kirjoita käyttötapaus ja kielletyt tehtävät. 2. Kokoa hyväksytty tietopohja. 3. Päätä, mitä järjestelmiä AI saa lukea ja kirjoittaa. 4. Määritä ihmiseen siirron ehdot. 5. Testaa epäselvät, vihaiset ja sääntöjä rikkovat puhelut. 6. Avaa pilotti rajatulle liikenteelle. 7. Seuraa yhteenvetoja, virheitä ja asiakaspalautetta.
Jos pilotti onnistuu, laajenna yksi käyttötapaus kerrallaan. Älä yritä tehdä kerralla yleisälykästä asiakaspalvelijaa. Sellainen on hieno demossa ja raskas tuotannossa.
Avustaja ihmiselle vai suora automaatio?
Generatiivista AI:ta ei tarvitse viedä heti asiakkaan kanssa puhuvaksi järjestelmäksi. Monelle yritykselle parempi ensimmäinen askel on käyttää LLM:ää asiakaspalvelijan avustajana. Se voi ehdottaa vastausta, hakea ohjeen, tiivistää puhelun ja kirjoittaa CRM-merkinnän, mutta ihminen hyväksyy lopputuloksen.
Tämä malli on hyvä silloin, kun prosessi on monimutkainen, data on herkkää tai organisaatio vasta opettelee AI:n käyttöä. Ihminen näkee, missä malli auttaa ja missä se yrittää olla liian varma. Samalla syntyy aineistoa tulevaa automaatiota varten: mitkä kysymykset toistuvat, missä AI:n ehdotus hyväksytään suoraan ja missä tarvitaan korjauksia.
Suora automaatio sopii paremmin rajattuihin käyttötapauksiin. Jos asiakas haluaa tietää aukioloajat, siirtää ajan tai tarkistaa tilauksen tilan, AI voi hoitaa asian ilman, että ihminen lukee jokaista vastausta. Jos asiakas pyytää hyvitystä, kertoo arkaluonteisia tietoja tai kysyy sopimuksen tulkintaa, ihmisen rooli voi olla välttämätön.
Hyvä eteneminen ei ole joko-tai. Sama LLM voi ensin auttaa ihmistä, sitten hoitaa osan puheluista itsenäisesti ja lopuksi toimia hybridimallissa. Olennaista on, että automaatiotaso valitaan käyttötapauksen mukaan, ei myyntiesitteen rohkeuden mukaan.
Mitä toimittajalta pitää kysyä LLM-puhelinpalvelusta?
Kun ostat LLM-pohjaista puhelinpalvelua, älä kysy vain, mitä mallia käytetään. Se on kiinnostava tieto, mutta harvoin tärkein. Kysy, miten palvelu on rakennettu mallin ympärille.
Hyviä kysymyksiä ovat:
- Mistä tietopohjasta AI vastaa?
- Miten tieto päivitetään ja kuka hyväksyy muutokset?
- Mitä tapahtuu, jos tietoa ei löydy?
- Mitä työkaluja AI saa käyttää?
- Milloin asiakkaalta pyydetään vahvistus?
- Miten puhelu siirtyy ihmiselle?
- Mitä lokeihin tallentuu ja kuinka kauan?
- Käytetäänkö asiakasdataa mallien kouluttamiseen?
- Miten suomenkielinen puheentunnistus on testattu?
- Miten virheellisiä vastauksia seurataan ja korjataan?
Näihin pitäisi saada käytännön vastauksia. Jos vastaus jää tasolle käytämme uusinta tekoälyä, se ei vielä tarkoita mitään. Uusin tekoäly voi edelleen käyttää väärää dokumenttia, tehdä väärän API-kutsun tai antaa huonon vastauksen hyvällä äänellä.
Toimittajan kypsyys näkyy usein siinä, miten hän puhuu rajoista. Jos kaikki on mahdollista heti, kannattaa hidastaa. Tuotannossa tärkeintä ei ole mahdollisuuksien määrä vaan se, mitkä mahdollisuudet on turvallista avata ensimmäisenä.
Kustannus ei ole pelkkä mallikutsu
LLM-puhelinpalvelun kustannusta arvioidaan helposti väärästä kohdasta. Mallikutsun hinta on vain yksi osa. Mukana ovat puheentunnistus, puhesynteesi, puhelinliikenne, integraatiot, lokitus, ylläpito, testaus ja ihmisen tekemä laadunvalvonta. Halpa malli voi tulla kalliiksi, jos se vaatii paljon korjausta tai tekee huonoja yhteenvetoja.
Siksi kustannusta kannattaa verrata hoidettuun asiaan, ei pelkkään minuuttiin. Kuinka monta puhelua ratkeaa oikein? Kuinka paljon jälkikirjausta säästyy? Kuinka monta vastaamatonta puhelua saadaan kiinni? Kuinka usein ihminen joutuu korjaamaan AI:n tekemän merkinnän?
Kun kustannus sidotaan lopputulokseen, keskustelu muuttuu järkevämmäksi. Silloin ei osteta halvinta tekoälyä vaan parasta tapaa hoitaa tietty asiakasprosessi.
Älä automatisoi epäselvää vastuuta
Jos organisaatio ei tiedä, kuka saa päättää asiasta ihmisenä, LLM ei saa päättää sitä automaattisesti. Tämä kuulostaa itsestään selvältä, mutta moni AI-projekti paljastaa juuri tällaisia vastuun harmaita alueita. Ensin päätetään prosessi. Vasta sitten malli opetetaan toimimaan sen sisällä.
Yhteenveto
Generatiivinen AI tekee asiakaspalvelusta joustavampaa, kun sitä käytetään oikein. LLM ymmärtää vapaata puhetta, muotoilee vastauksia, tiivistää keskusteluja ja käyttää työkaluja. Tuotantokelpoinen puhelinpalvelu syntyy kuitenkin vasta, kun mukana ovat hyväksytty tietopohja, integraatiot, guardrailit, lokitus ja ihmisen eskalointi.
Yrityksen ei kannata kysyä vain mikä malli on paras. Parempi kysymys on: mikä asiakasprosessi kannattaa automatisoida, mitä tietoa se tarvitsee ja missä kohdassa ihmisen pitää ottaa vastuu? Aisteri auttaa rakentamaan LLM-pohjaisen puhe-AI:n näiden kysymysten ympärille. Kysy lisää: visa.valkonen@aisteri.fi tai kokeile konfiguraattoria.
Lisää tästä aiheesta
Tutki koko opas-kategoria
Jos tämä artikkeli osui hermoon, samasta kategoriasta löytyy lisää käytännön juttuja ilman konsulttiliirumlaarumia.
Avaa kategoriakeskus

