Veri Ürünlerini ‘Daha Fazla Veri’ Yanılgısının Ötesinde Tasarlamak
Veri ürünleri ancak bağlam, yorumlama, yönetişim ve verinin etrafındaki insan emeği tasarlandığında değer üretir.
Veri Ürünlerini ‘Daha Fazla Veri’ Yanılgısının Ötesinde Tasarlamak
Veri ürünü ekipleri çoğu zaman bir büyüme varsayımıyla yola çıkar: daha fazla veri ürünü daha iyi yapacaktır. Daha fazla olay, daha fazla öznitelik, daha fazla entegrasyon, daha fazla pano, daha fazla model özelliği. Klaus Hoeyer’in Data Paradoxes kitabı, başlığı, içindekiler bölümü ve girişinden hareketle gerekli bir düzeltme sunar: daha fazla veri değer yaratabilir, ama paradokslar da yaratabilir.
Kitap çağdaş sağlık hizmetlerinde yoğunlaşan veri toplama pratiklerini, Danimarka örneği üzerinden inceler. Danimarka sıradan olduğu için değil, ileri olduğu için seçilmiştir: dijitalleşmiş sağlık hizmetleri, bütünleşik veri altyapıları ve sektörler ile yaşam süresi boyunca izlemeyi mümkün kılan kişisel kimlik numaraları. Bu nedenle veri odaklı vaatler için güçlü bir test alanıdır.
Alıntı bu vaatleri açıkça anlatır. Veri odaklı sağlık hizmetlerinden hastalığı öngörmesi, kişiselleştirilmiş rejimler sunması, bazı insan yorumlarını yapay zeka ile değiştirmesi, sağlık hizmetlerini ucuzlatması ve akıllı algoritmalarla yönetişimi optimize etmesi beklenir. Veri ve yapay zeka ürünleri geliştiren herkes bu vaatlere aşinadır. Modern, rasyonel ve kaçınılmaz görünürler.
Fakat Hoeyer’in argümanı, veri vaatlerinin yerel pratiklerle çarpıştığıdır. Veri çıkarılmayı bekleyen basit bilgi değildir. Farklı aktörler tarafından farklı amaçlarla üretilir, kategorize edilir, temizlenir, taşınır, yorumlanır ve kullanılır. Aynı veri araştırmaya, klinik bakıma, yönetime, politikaya, yönetişime ve ticari çıkarlara hizmet edebilir. Bu çoğulluk gerilim yaratır.
Teknoloji danışmanları için bu bir ürün tasarımı meselesidir. Veri çokluysa, veri ürünü yalnızca depolama, boru hatları ve modeller etrafında tasarlanamaz. Kullanım bağlamları etrafında tasarlanmalıdır. Veriyi kim üretir? Veri işinin yükünü kim taşır? Çıktıyı kim yorumlar? Kim fayda görür? Kim riske maruz kalır? Ürün hangi kararları etkiler?
İçindekiler bölümü faydalı bir ürün çerçevesi önerir: vaatler, yaşam, iş, deneyimler, bilgelik ve pandemi siyaseti. Ürün diline çevrildiğinde her veri ürününün bir vaat katmanına, kullanıcı bağlamı katmanına, operasyon katmanına, deneyim katmanına, karar kalitesi katmanına ve kriz ya da uç durum katmanına ihtiyacı vardır.
Bu özellikle yapay zeka sistemleri için önemlidir. Birçok yapay zeka başarısızlığı dar anlamda model başarısızlığı değildir. Veri pratiği başarısızlığıdır. Veri gerçekliği değil idari kolaylığı kodlayabilir. Kategoriler kullanıcı deneyimiyle uyuşmayabilir. Toplama süreci ek emek yaratabilir. Pano sahte kesinlik üretebilir. Model, sonucu anlamlı biçimde kontrol edemeyen kullanıcılara sorumluluk yükleyebilir.
OzyCore için ders, veri ürünlerini varsayılan olarak “daha fazla veri” değil, hedef olarak “daha iyi veri kullanımı” ile tasarlamaktır. Bu, yönetişimi ürünün içine almak, izlenebilirliği desteklemek, belirsizliği görünür kılmak ve verinin etrafındaki insan iş akışını anlamak demektir. Aynı zamanda Hoeyer’in öne çıkardığı rahatsız edici soruyu sormak anlamına gelir: kimin için daha iyi ve hangi ölçütlere göre?
Olgun bir veri stratejisi veri hacmine tapmaz. Veriyi altyapı, pratik ve güç olarak ele alır. Bu anlayışla kurulan ürünler daha güvenilir, daha kullanışlı ve daha dayanıklı olur.