Büyük Veri tüm endüstriler gibi Medya’yı da etkiliyor.
Medya’da, gazeteler, televizyonlar, dergiler ve internet yayıncıları, Big data stratejilerini kullanarak: kullanıcıların bıraktığı bilgi yığınlarını (sosyal medya paylaşımları, mobil cihazlardaki uygulama kullanımları, web sayfalarında bırakılan bilgiler, nesnelerin interneti sayesinde oluşan sensör verileri gibi hareketler) analiz ediyor. Bu sayede daha iyi bir kullanıcı deneyimi oluşturup, daha etkili haberler, hikayeler ve reklam politikası oluşturabiliyorlar.
Büyük Veri dediğimiz ekosistem aslında sadece verinin büyüklüğü değil; verinin toplanması, analiz edilmesi, saklanması yani veriden bir değer kazanılmasıdır. Birçok global firma ve kuruluş Big Data ekipleri oluşturuyorlar. Çünkü verisi en çok olan değil, o veriden en iyi anlam çıkartan, en iyi analiz yapan en güçlüdür. Öncelikle, Big data’yı anlamak için veri çeşitliliği, veri hacmi ve veri hızının ne olduğunu anlayalım.
Veri Çeşitliliği
Veri tipleri, yapılandırılmış ve yapılandırılmamış olarak ikiye ayrılıyor. Günümüzdeki verilerin (dataların) %80’inden fazlası yapılandırılmamış şekilde bulunuyor. Yapılandırılmamış veriler içerik olarak; video, fotoğraf, yorum, e postalar, web sayfası vb. şekilde tek bir başlık altında toplanamayan çeşitli verilerden oluşuyor.
Detaylandırırsak, bahsedilen iki veri tipine yarı yapılandırılmış ve karmaşık yapılandırılmış veri başlıkları altına ayırabiliriz. Çeşitliliği ve miktarı fazla olan bu verileri ayıklamak ve işlemek için farklı araçlar/yazılımlar kullanılmaktadır.
Yazılım örneği: IBM Apache Hadoop: Büyük veri, öngörüler ve inovasyon için tasarlanmıştır. Yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış verilerin dağıtımlı işlenmesi için bir açık kaynak platformu olarak IBM ve Hortonworks’un kurumsal ölçekte dağıtımı için platform oluşturmuştur. Kurumsal Veri Ambarı’na (EDW) alınamayan ses, video, sosyal medya, duygu ve tıklatma verileri gibi yarı yapılandırılmış ve yapılandırılmamış yeni veri formlarını kullanabilir hale getiriyor. Bu veriler, Nesnelerin İnterneti (IOT), yapay zeka (AI), bulut ve mobil gibi günümüzün yeni teknolojilerine yanıt olarak daha etkili analizler yapılmasını sağlıyor.
Veri Hacmi
Büyük Veri her geçen saniye büyüyor. Özellikle, Sosyal medya’dan ve Nesnelerin interneti (Internet of Things) ile cihazlardan gelen veriler(bilgiler) veri hacmini büyük ölçeklere ulaştırıyor. 2025 yılındaki veri miktarı, 2011 yılında var olan verinin 50 kat fazlası olacağı tahmin ediliyor. Veri dünyasını anlamlandırırken, hacimlerinin nasıl ayrıldığını öğrenilmesi iyi olur. Verileri kendi içinde büyük ve küçük olarak ayrılıyor.
Küçük Veriler, Gigabayt ve daha küçük birimlerde depolama alanı kaplayan verilere denir. Yani, 1 GB = 1024 MB’a denk gelmektedir. Big data ise bulut hafızalarda veya diğer büyük depolama sistemlerinin; Terabayt, Petabayt, Zetabayt ve ötesi değerlerde bulunan bulunan verilere denir. Büyük ve Küçük verinin kapsadığı alanı bir örnek ile anlatmak gerekirse, 7 dakikalık yüksek kaliteli bir YouTube video, 1 gigabayt alan kapsamaktadır. 1 Petabyte ise 1 milyon Gigabyte’a eşit olur. Bu 13 yıllık yüksek kaliteli video içerik depolama alanını kapsamaktadır. Google ve YouTube günlük olarak 24 Petabyte’lık veri işlemektedir.
Veri Hızı
Büyük Veri’nin üretilme hızı çok yüksek ve her saniye artmaya devam ediyor. Üretilen verilerin, işlem sayısı ve çeşitliliği de aynı hızda artıyor bu şekilde artmaktadır.
Google ve YouTube’un günlük olarak 24 Petabyte’lık veri işlemesinin nedeni budur.
Domo’s Data Never Sleeps 5.0 raporuna göre Dünya’da dakika başına;
Kullanıcılar 4.146.600 YouTube videosu izliyor.
Twitter’da 456.000 tweet gönderiyor.
Google’da her dakika 3.7 milyon arama yapıyor.
Big data’nın hayatımıza girişi tesadüfen sonuç gerçekleşmedi. Mobil teknolojilerin gelişimi dijital medya depolama oranlarının artışı, akıllı telefonlar dahil tüm dijital cihazların dünya genelinde popülerleşmesi ve dijital medyanın katlanarak büyümesi süreci hızlandırdı. Cloud sistemlerindeki gelişimler ile birlikte depolama alanlarının maliyetleri de azalmaya başladı. 1992 yılında 1 gigabaytlık alanın değeri 569$ iken günümüze doğru kuruş değerlerine düştü ve azalmaya devam ediyor.
Peki, Medya şirketleri Büyük Veriyi nasıl benimsiyor?
Verilerin yığınların artması ile medya ve eğlence şirketleri daha fazla müşteriye erişmek için kullanıcı hareketlerini analiz ediyorlar. Bunun bir örneği touchpoint özelliği, Kullanıcı site içi hareketlerini inceleyerek website üzerindeki kullanıcı hareketleri analiz ediliyor. Bu doğrultuda daha etkili bir kullanıcı deneyimi sağlama imkânı oluşuyor. İçerik sağlayan şirketlere kayıtlı olan her bir kullanıcı, yaş, demografik bilgi gibi birçok bilgiyi sunuyor, Bu doğrultuda içerik üreticileri içerik planlaması ve Reklam hedefi belirlerken bu verilerden faydalanıyor.
Netflix.com
Netflix kullanıcı verileri doğrultusunda kararlar alan ve kullanıcılarını merkeze yerleştiren kuruluşlardan birisidir. Kullanıcılar bilgisayar, televizyon ve akıllı cihazlardan içerik tüketimi sistemi kullanırlar ve doğrudan veri üreticisi konumundadır. Netflix, Big data’yı doğru analiz metotlarıyla işleyerek müşterilerinin seyir zevkleri hakkında önemli bilgiler toplayarak kullanıcı odaklı üretim gerçekleştirmeyi hedefliyor.
Netflix’in son 6 yıldaki büyüme rakamlarına göz attığımızda 2018 yılının üçüncü çeyreğinde 135 milyon aboneye ulaştığı belirtiliyor. Kullanıcılardan elde edilen veriler onların görüntüleme alışkanlıklarını anlamak için toplanıyor ve inceleniyor.
- Veri Bilimcisi: Yeni sonuç algoritması daha fazla dizi/film oynatma etkisi oluşturuyor mu?
- Ürün Yöneticisi: Yeni kullanıcı arayüzü kullanıcıların içerik bulurken harcadıkları süreyi azaltıyor mu?
- Pazarlama: Hangi mail kampanyası daha yeni üye getiriyor?
- İçerik: Hangi görseli daha fazla dizi veya film izlenmesini sağlıyor?
Görseller için en az 6 adet alternatif görsel belirleniyor. Hatta, bu konuda kullanıcıların ilgisini anlamak için yüzlerce A/B testi yapılıyor. Bu doğrultuda A kullanıcısının deneyimlediği Netlflix uygulaması ile B kullanıcısın deneyimlediği Netflix uygulaması birbirinden farklı olabiliyor. Kendi paylaştıkları sonuçlara göre; kullanıcılar 2 milyon 97 bin 152 farklı eşsiz deneyim ile karşılaşıyor.
Veri Gazeteciliği
Veri Gazeteciliği, veri ile gazetecilik yapmaktır. Dijitalleşen haber odalarının veriyi etkili kullanarak hikâye, bilgi aktarımı yapılmasını sağlayan bir gazetecilik türüdür. Verinin gerçekten ne olduğunu anlama, soru sorma ve veriyle ilişkide şüpheci olma. Farklı disiplinleri de kullanarak geliştirilen bu süreç geleneksel gazeteciliğe göre daha etkili şekilde haberi anlatmaktır.
Artık haber odaları kod bilen, veri setlerini analiz edebilen, excel veya farklı araçları etkin şekilde kullanabilen, yazılımdan, programlamadan anlayan, istatistik bilgisi olan ve veri bilimini bilen kişilere ihtiyaç duymaktadır. Çünkü artık metinden daha güçlü hikâye ve haber anlatılmasını sağlayan teknikler gelişiyor. Öte yandan, veriler artık sadece rakamlardan oluşmuyor. Fotoğraf, video, ses kayıtları, metinler de artık programlama dilleriyle ölçülebilir hale geliyor. İnteraktif haritalar, detaylı grafikler, infografikler, üç boyutlu tasarımlar gibi bilgiyi, haberi, hikayeyi daha dikkat çekici ve anlaşılır olmasını sağlayan bir teknoloji var.
Aşağıdaki görsel 5G teknolojisini anlatmaya dair bir örnek. G teknolojilerini daha iyi anlamak ve anlatmak için verilerin görselleştirmesi anlaşılır hikaye anlatılmaktadır.
Huffington Post CEO’su Jimmy Maymann: Verinin herşeyi kapsadığını belirtiyor. Büyük ve Küçük veriyi (UX) kullanıcı deneyimini geliştirmek için, sosyal trendler, kullanıcı yorumları, ölçümler ve daha çok kişiselleşme sağlamak için kullandıklarını belirtiyor. Küçük veri kapsamında kullanıcı deneyimini Arama motoru optimizasyonu, etkili içerik ve tüketici araştırması için kullandıklarını dile getiriyor.
Huffington Post
Benzersiz kullanıcılar: 90 milyon kullanıcı
Aylık ziyaretçi: 22 milyon
Aylık video görüntüleme: 110 milyon
Günde yayınlanan ortalama öyküler: 1.600
Gün başına ortalama yorum: 1300
Popüler haber ve sosyal paylaşım sitesi BuzzFeed büyük trafik rakamlarını viral içerik yayınlayarak kazanıyor. Sitenin Veri uzmanı Ky Harlin veriyi kullanıcı tercihlerini anlamak için kullandıklarını belirtiyor. Siteye yükledikleri içeriklerin etkileşim alma oranlarını anlamak, hangi görsel, hangi başlıkların daha çok rağbet gördüğünü, kullanıcı deneyimleri sayesinde görebildiklerini belirtiyor.Harlin, veriyi nasıl kullandıklarına dair bir örnek; Silahlı görseller, yemek fotoğrafları, Kırmızı renk ve bikinili kadınlar sitedeki trafik oranlarını arttırdığını keşfettiklerini belirtiyor.
BuzzFeed
Aylık benzersiz kullanıcıları: 163 milyon
Global Total kullanıcıları: 650 milyon
Aylık içerik gösterimi: 9 milyar
Kullanıcıların % 70 mobil’den
Kullanıcıların %42 sosyal medya’dan