veri bilimi, veri bilimci, data scientist, veri analisti, veri uzmanı, veri analizi, istatistiksel analiz, veri analitiği, modelleme, kümeleme, segmentasyon, yazılım geliştirici, makine öğrenme becerisi, veri görselleştirme, python, türkiye veri bilişim, veri bilişimci nasıl olunur, veri bilişimci iş alanı, veri bilişimci ücret,
Veri Bilimi
Son birkaç yılda önem kazanan popüler meslek dalı; Veri bilimcileri ve yazılım geliştiricileri ABD’de yılda ortalama 100,000 dolar kazanıyor. Veri bilimcilerine (data scientist) olan talep, Şirketler tüketici davranışlarını anlamaya çalıştıkça, artıyor.
Veri bilimciliği, tüm dünyada ve Türkiye'de talep gören iş alanlarından biri. Glassdoor'un 2016 ve 2017 yıllarında
"Amerika'daki En İyi İşler" listesinde 1 numaralı sırada yer aldı ve
2018 ocak ayında yayınlanan rapora göre; iş ilanları sayısı, maaş seviyesi ve
genel iş doyumu kriterleri incelendiğinde bu senede en popüler iş alanı olarak,
yazılım geliştiriciliği ile birlikte 1 numarada yer alıyor. 2018 itibarı ile
ABD de en popüler işler sıralamasında İkinci sırada iş geliştirme mühendisliği
yer alıyor.
Veri Bilimci nedir ne iş yapar (data scientist)
Bir işletmenin operasyonları iyileştirmesine yardımcı olan ve
rakiplerine kıyasla rekabet üstünlüğü kazanmanın yollarını belirlemek için
büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak için, matematik,
istatistik ve bilişim teknolojilerini kullanan kişi veri bilimcisi ve yaptığı
işe veri bilimi denir.
Veri bilimci, istatistiksel analizin ötesinde bakış açısı sağlamak
için makine öğrenimi (veri analizinde yapay zeka kullanımına dair makine
davranışları) ve tahmini modelleme de dahil olmak üzere gelişmiş analitik
teknolojilerin kullanılmasını içeren istatistikçi rolünün bir dalıdır.
Şirketler, büyük bir şirketin ürettiği ve topladığı çok miktarda yapılandırılmış,
yapılandırılmamış ve yarı yapılandırılmış veriden - toplu olarak büyük veriler
olarak adlandırılan - yararlı bilgiler toplamak istediğinde, veri bilimi
becerileri talebi son yıllarda önemli ölçüde artmıştır. (www.ihracat.co)
Veri bilimci rolleri ve sorumlulukları
Veri bilimci rolü için gerekli kişilik özellikleri, deneyim ve
analitik becerilerin karışımını bulmak zor kabul edilir, bu nedenle nitelikli
veri bilimcileri için talep son yıllarda arzı aşmıştır. İş dünyası memnuniyeti,
iş ilanları sayısı ve yüksek maaş beklentisi gibi ölçümlere dayalı olarak, veri
bilimcisi 2018 yılında En İyi 50 İş listesinin başında yer aldı.
Temel sorumluluklar, veri toplamak ve analiz etmek ve veri
takımlarındaki kalıpları, trendleri ve ilişkileri tespit etmek için çeşitli
analiz ve raporlama araçlarını kullanmaktır. Veri bilimcileri, genellikle,
müşteri davranışlarını tahmin etmek ve iş risklerini ve fırsatlarını tespit
etmek için kullanılabilecek bilgi için büyük verilerin keşfedilmesi için ekip
halinde çalışırlar.
Veri bilimcileri nasıl çalışır
Veri bilimcileri, veri analizi için istatistiksel öğrenme modelleri
geliştirmekle görevlidir ve istatistiksel araçlar kullanmanın yanı sıra
karmaşık tahmini modelleri oluşturma ve değerlendirme becerisine sahip
olmalıdırlar.
Bir veri bilimci, hipotez geliştirmek, çıkarım yapmak ve müşteri, iş
dünyası ve pazar eğilimlerini göz önüne almak için büyük miktarda veri
kullanmaktadır. Veri bilimcisi, dersi değiştirmeyi, bir süreci veya ürünü
geliştirmeyi veya yeni hizmetler veya ürünler yaratmayı içerebilen iş
kararlarını almak için analitik verilerin nasıl kullanılacağını açıkça
belirtmelidir. Sonrasında, veri bilimcisi geliştirme sürecine katılır. Örneğin
yazılım söz konusu olduğunda, veri bilimcisinin rolü yeni özellikler önermek
için veri analitiklerini kullanmayı gerektirir.
Veri bilimcileri, veri toplama, analitik teknolojinin kullanımı ve veri
yorumlaması için en iyi uygulamaları da belirler.
Veri bilimcisi olmak isteyenler ne yapmalı, neler öğrenmeli
Yeni başlayanlar için, Excel, SQL ve Tableau öğrenmeye başlamak doğru bir seçim olacaktır.
Biraz tecrübeniz varsa, veri projelerinde kullanmanız gereken Python, R ve SQL öğrenmeye odaklanabilirsiniz.
Tecrübeli bir analist veya programcı iseniz, teknik becerilerinizi geliştirmeye devam etmeli ve halihazırda kullanmadığınız diğer yazılımları da öğrenmeye, ve elinizdeki uygulamalrla aralarındaki farkları eksi ve artıları sürekli değerlendirmelisiniz.
Veri bilimci becerileri
Veri bilimcileri için gerekli olan becerilerden bir kısmı teknik değil entelektüel
donanımınızla ilgilidir; sezgileriniz, entelektüel merak ve yaratıcılık. Sosyal
beceriler de veri biliminin kritik bir parçasıdır ve birçok işveren, veri
bilimcilerini, bir organizasyonun her düzeyindeki insanlara, analiz ettiği verilerden
elde ettiği bilgiyi aktarmayı iyi bilen, iyi sunum becerilerine sahip kişiler
olmasını bekler. Veri bilimcilerinin bir organizasyonda veri odaklı karar verme
süreçlerini yönlendirmek için liderlik becerilerine sahip olması da beklenir.
Veri bilimcileri için eğitim gereksinimleri tipik olarak istatistik,
veri bilimleri, bilgisayar bilimi veya matematik alanında lisans derecesini
içerir.
İş için gereken zor beceriler arasında veri madenciliği, makine
öğrenimi ve yapısal ve yapılandırılmamış verileri bütünleştirme özelliği
bulunmaktadır. Modelleme, kümeleme ve segmentasyon gibi istatistiksel araştırma
teknikleriyle ilgili deneyimler de sıklıkla gereklidir.
Veri bilimcilerinin kullandığı yazılımlar
Veri bilimi, Hadoop, Pig, Hive, Spark ve MapReduce ve yapılandırılmış
sorgu dili (SQL), Python, Scala ve Perl'in yanı sıra istatistiksel bilgisayar
programlama dilleri de dahil olmak üzere birçok önemli veri platformu ve
program dillerine hakim olması beklenir.
Veri bilimci, veri analisti karşılaştırması
Veri bilimcinin işi çoğu zaman veri analistinin ki ile karıştırılır
ancak birçok beceride örtüşme olduğu halde önemli farklılıklar vardır.
Bir veri analistinin işi şirkete bağlı olarak değişse de, genel olarak
veri analistleri verileri toplar, bu verileri işler ve standart istatistiksel
araçlar ve teknikler kullanarak istatistiksel analiz gerçekleştirir. Analistler
ayrıca, iş süreçlerinde, ürünlerde veya hizmetlerde iyileştirmeler için yeni
fırsatları belirlemek için kalıpları belirler ve veri setlerinde korelasyon
oluştururlar. Bazı durumlarda, veri analistleri ayrıca büyük veri ve ilişkisel
veritabanı sistemlerini tasarlar, oluşturur ve korurlar.
Veri analistleri ABD de yılda ortalama 60.000 USD kazanmaktadır.
Veri bilimcileri ise hem veri analistlerinin işlerinden sorumludur hem
de bu analizleri makro ve mikro düzeyde algoritmalar geliştirmek için
kullanabilirler. Veri bilimcileri, gelişmiş verileri kullanarak büyük verileri
analiz edebilecek donanıma sahiptir ve belirli problemler için yeni
algoritmalar geliştirmek için araştırma geçmişine sahip olmaları
beklenmektedir.
Ayrıca çözülecek özel bir sorun olmaksızın verileri keşfetmekle görevli
olabilirler. Bu senaryoda, verileri ve işletmeyi, işletme operasyonlarını,
ürünleri, hizmetleri veya müşteri ilişkilerini iyileştirmek amacıyla, soruları
formüle edecek ve işletme yöneticilerine kavrayışlar sunacak kadar iyi anlamak
gerekir. (www.ihracat.co)
VERİ BİLİMCİLERİN SAHİP OLMASI GEREKEN BİLGİ VE BECERİLER
1- Veri bilimcileri, Programlama dillerine
hakim olmalıdır
Veri Bilimi Becerileri - Programlama – Çalıştığınız şirketin sektörü ne
olursa olsun, muhtemelen ticaret araçlarını nasıl kullanacağınızı bilmeniz
beklenir. Bu sebeple örneğin Python gibi istatistiksel bir programlama dili ve
SQL gibi bir veritabanı programını kullanabiliyor olmanız gerekmektedir.
2- Veri bilimcileri, İstatistik konusunda
bilgili olmalı
Veri bilimci olarak istatistiklerin iyi bir şekilde anlaşılması
hayati öneme sahiptir. İstatistiksel testler, dağılımlar, maksimum olasılık
tahmincileri, vb. konulara aşina olmalısınız. Bu, aynı zamanda makine öğrenimi
için de geçerlidir, ancak istatistik bilgilerinizin en önemli yönlerinden biri,
farklı tekniklerin ne zaman (veya değil) geçerli bir yaklaşım. İstatistikler, tüm
şirket türlerinde önemlidir, ancak paydaşların kararlarını vermek ve deneyleri
tasarlamak / değerlendirmek için yardımınıza bağlı olduğu özellikle veri odaklı
şirketler önemlidir.
3- Veri bilimcileri, Makine öğrenme
becerilerine sahip olmalıdır
Özellikle büyük miktarda veri içeren bir şirkette veya ürünün
kendisinin özellikle veri odaklı olduğu bir şirkette (örn. Bilişim, medya,
reklam, pazarlama firmaları) çalışıyorsanız, makine öğrenme yöntemlerine aşina
olmanız gerekmektedir. Bu tekniklerden birçoğunun R veya Python kütüphaneleri
kullanılarak uygulanabileceği doğrudur bu nedenle, algoritmaların nasıl çalıştığına
dair bir uzman olmak zorunlu değildir. Veri bilimcisinin farklı teknikleri
kullanmanın ne zaman uygun ve gerekli olduğunu biliyor olması bu işteki başarı
kriterini belirler.
Makine öğrenme nedir: Makine
öğrenimi, yazılım uygulamalarının net olarak programlanmadan sonuçların
tahmininde daha doğru olmasını sağlayan yapay zeka (AI) bir türüdür. Makine öğreniminin
temel önceliği, giriş verilerini alabilen ve bir çıktı değerini kabul
edilebilir bir aralıkta öngörmek için istatistiksel analizi kullanabilen
algoritmalar oluşturmaktır.
4- Veri bilimcileri, Çok Değişkenli
Analiz yapabilmeli ve Lineer Cebir bilmeli
Bu kavramları anlamak, ürünün veriyle tanımlandığı şirketlerde çok
önemlidir ve tahmini performansdaki veya algoritma optimizasyonundaki küçük
gelişmeler şirket için büyük kazanımlara neden olabilir.
Bir veri bilimi rolüyle ilgili bir röportajda, başka yerde çalıştığınız makine öğrenimi veya istatistik sonuçlarından bazılarını türetmeniz istenebilir. Veya görüşmeci, bu tekniklerin temelini oluşturduğu için, temel çok değişkenli hesap veya doğrusal cebir sorularını isteyebilir.
Python veya R'de çok sayıda kutu uygulaması olduğunda, bir veri
bilimcisinin bunu neden anlaması gerektiğini merak edebilirsiniz. Yanıt, belli
bir noktada bir veri bilim ekibinin, bir yazılım oluşturması veya geliştirmesi
beklenebilir. (www.ihracat.co)
5- Veri bilimcileri, Veri kusurları
ve eksiklilkleri ile başedebilmeli
Analiz edeceğiniz veriler çok dağınık ve/veya çok geniş bir alanı
kapsıyor olabilir. Bu nedenle, verilerdeki eksiklik ve kusurlarla nasıl başa çıkacağını
bilmek gerçekten önemlidir. Veri kusurlarına örnek olarak, eksik değerler,
tutarsız dize biçimi, tarih biçimlendirmesi, unix zamanı, zaman damgaları vs..
6- Veri bilimcileri, Veri Görselleştirme
ve İletişim tekniklerine hakim olmalı
Veri bilimcileri, elde ettikleri bulguları, ilgili kişi ve birimlere
aktarırken, doğru iletişim ve görselleme tekniklerini kullanmalı, bu aşamada,
elde ettikleri verilerin nasıl algılanacağını nasıl gözlemleneceğini öngörüyor
olmaları beklenir.
Görselleştirme açısından, matplotlib, ggplot veya d3.j gibi veri görselleştirme
araçlarını tanımak son derecede yardımcı olabilir. Sadece verileri görselleştirmek
için gerekli olan araçları değil, aynı zamanda görsel olarak veri şifreleme ve
bilgi iletişiminde kullanılan ilkeleri de bilmek önemlidir.
7- Veri bilimcileri ve Yazılım Mühendisliği
Özellikle küçük bir şirkette, tek başına veya küçük bir ekiple çalışan
firmaların öncelikli tercihi, yazılım mühendisliği kökenli bir veri bilimciyle
çalışmak olacaktır. Program kullanma ve geliştirme becerilerinin yardımı
olmadan bir sürü veri günlüğü ile potansiyel olarak veri odaklı ürünlerin geliştirilmek
zor olacaktır. Veri bilişimini faaliyet alanı olarak seçen firmalarda ya da
veri bilişimi için ekip kuran firmalarda, veri bilimcilerin matematik,
istatistik, pazarlama gibi farklı meslek kökenlerinden uzmanları da içermesi
faydalı olacaktır.
8- Veri bilimcileri Veri Sezgisi
İşverenler, veri bilimcilerinin, veri odaklı bir problem çözücü olduğunu
görmek istiyorlar. Veri bilimcileri bir iş mülakatında ya da veribilimi ve
analizine yönelik başka bir firmadan gelen bir iş talebinde Görüşme sürecindeki
bir noktada, şirketin geliştirmeyi istediği veri odaklı ürüne yönelik bir soru yöneltebilirler.
Önemli olan, size sunulan rakamlar ve teknik detaylar hakkında sezgilerinizin
kuvvetli olması. Hem müşterilerin, hem çalıştığınız departmanalrın talep ve
beklentilerini anlayabilmenizdir. Veri bilimcisi olarak, mühendisler ve ürün yöneticileri
ile nasıl etkileşim kurmalısınız? Hangi yöntemleri kullanmalısınız? Yaklaşımlar
ne zaman mantıklı olur? (www.ihracat.co)
YORUM