Hyppää sisältöön

AutoCare-ylläpitotyökalumme sai tekoälyltä silmät

AutoCare tunnetaan luotettavana ylläpitotyökaluna, joka on jo vakiinnuttanut paikkansa digitaalisten palveluidemme huoltajana. Nyt se on saanut uuden, jännittävän päivityksen tekoälystä.

Mark Vicuña, 04.03.2024

Tekoälyn hyödyntäminen AutoCaressa on hyppy kohti fiksumpaa ja käyttäjäystävällisempää tapaa huoltaa verkkosivustoja.

Erinomainen automaatio muuttui entistä paremmaksi

Visuaalinen regressiotestaus on aina ollut hieno automaatio, mutta ei aivan täydellinen. Pienetkin visuaaliset poikkeamat voivat aiheuttaa hälytyksiä, mikä johtaa prosessin pysähtymiseen ja manuaaliseen tarkastukseen. Manuaalinen tarkastus on usein tarpeellinen, mutta vie myös paljon aikaa. Tehtävä voi myös osoittautua tarpeettomaksi, mikäli hälytys on ollut turha.

Kaksi lähes samaa kuvaa verkkosivusta
Näyttävätkö nämä kuvat samoilta?

Visuaalinen regressio on olennainen osa AutoCarea. Kun AutoCare päivittää verkkosivustoa, käytämme joukkoa visuaalisia regressiotestejä tarkistamaan sivuston ulkonäön ja toiminnallisuuden ennen ja jälkeen päivityksen. Se on menetelmä, joka on avustanut meitä paljon. Siihen on kuitenkin yhä vaikeampi luottaa, kun sivustot muuttuvat monimutkaisemmiksi ja dynaamisemmiksi.

Yksittäinen sivu modernilla verkkosivustolla koostuu yleensä useista liikkuvista osista, jotka voivat saada sivun näyttämään hieman erilaiselta joka kerta, kun se latautuu. Kun otetaan huomioon evästebannerit ja skriptit, joiden latausajat vaihtelevat, kuulostaa kahden hallitun kuvakaappauksen ottaminen samasta sivusta mahdottomalta tehtävältä.

Jopa kaikkein pienimmät, ihmiselle huomaamattomat erot saattavat saada tavallisen visuaalisen regressiotestin tulkitsemaan, että se katsoo kahta täysin eri asiaa.

Erot kahden kuvan välillä merkittynä punaisella, kuva peräisin visuaalisesta regressiotestistä
Yksittäinen pikselin siirtymä sisällössä nähtynä tavallisen visuaalisen regressiotestin silmin (punainen osoittaa eroja).

Kuinka siis voimme erottaa todelliset, merkittävät muutokset verkkosivustossa? Pystyisimmekö rakentamaan älykkään visuaalisen regressiotestin, joka voi katsoa sivua ja ymmärtää eron kriittisen virheen ja pienen sisällön muutoksen välillä?

Kun tehtävänä on ohjelmoida ohjelmamme tekemään päätöksiä kuin ihminen, olemme löytäneet hyvän käyttötarkoituksen tekoälylle.

Tekoäly päätöksentekijänä

Care-tiimissämme otimme haasteen vastaan selvittääksemme, voisiko ChatGPT auttaa meitä tässä pyrkimyksessä. Ajoitus oli oikea, sillä OpenAI oli juuri julkaissut API-rajapinnan GPT-4 Vision -malliin, mikä mahdollistaa kuvien lähettämisen ChatGPT:lle analysointia ja vertailua varten.

Teknisellä tasolla integraation luominen automaatiotyökaluumme oli yllättävän suoraviivaista. Todellinen työ alkoi, kun tuli aika miettiä, mitä meidän oli tarkoitus sanoa uudelle avustajallemme visuaalisen regressiotestauksen asiantuntijalle.

Sopivan kehotteen keksiminen muodostui luovaksi haasteeksi. Oli varsin työlästä saada asiantuntijamme tuottamaan käyttökelpoisia vastauksia. Yksi yllättävimmistä havainnoista oli se, kuinka ChatGPT joskus ”vetäytyi vastuusta” eikä halunnut asettua päätöksentekijän asemaan arvioimaan visuaalista regressiota. Samalla tavalla kuin ChatGPT saattaa kieltäytyä antamasta lääketieteellisiä neuvoja, se ei myöskään halunnut kantaa vastuuta rikkinäisen verkkosivuston julkaisusta.

Avustajan viesti: I'm sorry, but I can't assist with comparing these images. If you have any other questions or need assistance with a different topic, feel free to ask!
Pahoittelut, Dave. Pahoin pelkään, etten voi tehdä sitä.

Lopulta ChatGPT tunnisti erittäin hyvin ja itse asiassa melko älykkäästi tilanteet, joissa ihmisen asiantuntemus oli tarpeen. Uuden avustajamme ymmärrys visuaalisesta regressiosta ja laadunvalvonnasta oli jopa paljon tarkempi, kuin olimme ajatelleet. Saatoimme siis antaa sille vähemmän eksplisiittisiä ohjeita siitä, mihin sen tulisi kiinnittää huomiota ja mihin ei.

Avustajan viesti: However, since I need to ignore any cookie banner differences, other potential minor discrepancies may include variations in dynamic content such as time-sensitive information or interactive elements that may have changed state between the captures.
Tässä vaiheessa olimme vain kertoneet avustajallemme olla huomioimatta evästebannerit!

Useiden kehotekokeilujen ja muutaman tiimin sisäisen aivoriihen jälkeen saimme kehitettyä avustajamme päätöksentekotaitoja niin pitkälle, että uskalsimme antaa sille päätäntävallan AutoCare-järjestelmässä. Siitä tuli visuaalisen regressiotestauksen asiantuntija, johon voimme nyt luottaa aina, kun testaustulos tarvitsee ihmisasiantuntijan silmää ja arviointikykyä.

Jälleen kerran automaatio ja nyt myös tekoäly vapauttavat ammattilaistemme aikaa ratkaista luovempia ongelmia. Tämä näkyy erityisesti vastausnopeudessamme asiakkaidemme tukipyyntöihin.

Ensimmäinen askel on otettu

Tekoälyn integroiminen AutoCare-järjestelmään on antanut meille uutta perspektiiviä. Kun yleensä ajattelemme ChatGPT:tä työkaluna, ajattelemme usein sen kykyä käsitellä suuria tietomassoja vuorovaikutteisesti. Se jäsentää ja tiivistää tietoa erinomaisesti sekä tarjoaa apua monilla eri tavoilla.

Opimme kuitenkin, että mikrotasolla se loistaa pienten, mutta haastavien tehtävien suorittamisessa. Nämä tehtävät ovat toistuvia ja tavallaan helppoja, mutta ne saattavat olla liian ylivoimaisia automatisoida perinteisin menetelmin.

Tässä mielessä todellinen läpimurto meille oli oivallus, että olimme tunnistaneet sellaisen ongelman, jossa tekoäly saattaa olla paras ratkaisu. Toivomme, että tämä rohkaisee muitakin tutkimaan näitä työkaluja ja löytämään kokeilun kautta uusia tapoja kehittää omaa työtään.

Jatkamme tekoälyn sulauttamista yhä vahvemmaksi osaksi työtämme tavoitteenamme tarjota asiakkaillemme yhä parempaa palvelua. Olemme ottaneet ensimmäiset askeleet tekoälyn integroimiseksi automaatiojärjestelmäämme ja suhtaudumme innolla tekoälyn tarjoamiin uusiin mahdollisuuksiin tulevaisuudessa.

Haku