31.01.2018

VERİ BİLİMİ NEDİR, VERİ BİLİMCİ NASIL OLUNUR

data scientist, data science

Son birkaç yılda önem kazanan popüler meslek dalı; Veri bilimcileri ve yazılım geliştiricileri ABD’de yılda ortalama 100,000 dolar kazanıyor. Veri bilimcilerine (data scientist) olan talep, Şirketler tüketici davranışlarını anlamaya çalıştıkça, artıyor.

Veri bilimciliği, tüm dünyada ve Türkiye'de talep gören iş alanlarından biri. Glassdoor'un 2016 ve 2017 yıllarında "Amerika'daki En İyi İşler" listesinde 1 numaralı sırada yer aldı ve 2018 ocak ayında yayınlanan rapora göre; iş ilanları sayısı, maaş seviyesi ve genel iş doyumu kriterleri incelendiğinde bu senede en popüler iş alanı olarak, yazılım geliştiriciliği ile birlikte 1 numarada yer alıyor. 2018 itibarı ile ABD de en popüler işler sıralamasında İkinci sırada iş geliştirme mühendisliği yer alıyor.

Veri Bilimci nedir ne iş yapar (data scientist)
Bir işletmenin operasyonları iyileştirmesine yardımcı olan ve rakiplerine kıyasla rekabet üstünlüğü kazanmanın yollarını belirlemek için büyük miktarda veriyi toplamak, analiz etmek ve yorumlamak için, matematik, istatistik ve bilişim teknolojilerini kullanan kişi veri bilimcisi ve yaptığı işe veri bilimi denir.

Veri bilimci, istatistiksel analizin ötesinde bakış açısı sağlamak için makine öğrenimi (veri analizinde yapay zeka kullanımına dair makine davranışları) ve tahmini modelleme de dahil olmak üzere gelişmiş analitik teknolojilerin kullanılmasını içeren istatistikçi rolünün bir dalıdır.

Şirketler, büyük bir şirketin ürettiği ve topladığı çok miktarda yapılandırılmış, yapılandırılmamış ve yarı yapılandırılmış veriden - toplu olarak büyük veriler olarak adlandırılan - yararlı bilgiler toplamak istediğinde, veri bilimi becerileri talebi son yıllarda önemli ölçüde artmıştır. (www.ihracat.co)


Veri bilimci rolleri ve sorumlulukları
Veri bilimci rolü için gerekli kişilik özellikleri, deneyim ve analitik becerilerin karışımını bulmak zor kabul edilir, bu nedenle nitelikli veri bilimcileri için talep son yıllarda arzı aşmıştır. İş dünyası memnuniyeti, iş ilanları sayısı ve yüksek maaş beklentisi gibi ölçümlere dayalı olarak, veri bilimcisi 2018 yılında En İyi 50 İş listesinin başında yer aldı.

Temel sorumluluklar, veri toplamak ve analiz etmek ve veri takımlarındaki kalıpları, trendleri ve ilişkileri tespit etmek için çeşitli analiz ve raporlama araçlarını kullanmaktır. Veri bilimcileri, genellikle, müşteri davranışlarını tahmin etmek ve iş risklerini ve fırsatlarını tespit etmek için kullanılabilecek bilgi için büyük verilerin keşfedilmesi için ekip halinde çalışırlar.

Veri bilimcileri nasıl çalışır
Veri bilimcileri, veri analizi için istatistiksel öğrenme modelleri geliştirmekle görevlidir ve istatistiksel araçlar kullanmanın yanı sıra karmaşık tahmini modelleri oluşturma ve değerlendirme becerisine sahip olmalıdırlar.

Bir veri bilimci, hipotez geliştirmek, çıkarım yapmak ve müşteri, iş dünyası ve pazar eğilimlerini göz önüne almak için büyük miktarda veri kullanmaktadır. Veri bilimcisi, dersi değiştirmeyi, bir süreci veya ürünü geliştirmeyi veya yeni hizmetler veya ürünler yaratmayı içerebilen iş kararlarını almak için analitik verilerin nasıl kullanılacağını açıkça belirtmelidir. Sonrasında, veri bilimcisi geliştirme sürecine katılır. Örneğin yazılım söz konusu olduğunda, veri bilimcisinin rolü yeni özellikler önermek için veri analitiklerini kullanmayı gerektirir.

Veri bilimcileri, veri toplama, analitik teknolojinin kullanımı ve veri yorumlaması için en iyi uygulamaları da belirler.

data science

Veri bilimcisi olmak isteyenler ne yapmalı, neler öğrenmeli
Yeni başlayanlar için, Excel, SQL ve Tableau öğrenmeye başlamak doğru bir seçim olacaktır.

Biraz tecrübeniz varsa, veri projelerinde kullanmanız gereken Python, R ve SQL öğrenmeye odaklanabilirsiniz.

Tecrübeli bir analist veya programcı iseniz, teknik becerilerinizi geliştirmeye devam etmeli ve halihazırda kullanmadığınız diğer yazılımları da öğrenmeye, ve elinizdeki uygulamalrla aralarındaki farkları eksi ve artıları sürekli değerlendirmelisiniz.

Veri bilimci becerileri
Veri bilimcileri için gerekli olan becerilerden bir kısmı teknik değil entelektüel donanımınızla ilgilidir; sezgileriniz, entelektüel merak ve yaratıcılık. Sosyal beceriler de veri biliminin kritik bir parçasıdır ve birçok işveren, veri bilimcilerini, bir organizasyonun her düzeyindeki insanlara, analiz ettiği verilerden elde ettiği bilgiyi aktarmayı iyi bilen, iyi sunum becerilerine sahip kişiler olmasını bekler. Veri bilimcilerinin bir organizasyonda veri odaklı karar verme süreçlerini yönlendirmek için liderlik becerilerine sahip olması da beklenir.

Veri bilimcileri için eğitim gereksinimleri tipik olarak istatistik, veri bilimleri, bilgisayar bilimi veya matematik alanında lisans derecesini içerir.

İş için gereken zor beceriler arasında veri madenciliği, makine öğrenimi ve yapısal ve yapılandırılmamış verileri bütünleştirme özelliği bulunmaktadır. Modelleme, kümeleme ve segmentasyon gibi istatistiksel araştırma teknikleriyle ilgili deneyimler de sıklıkla gereklidir.


Veri bilimcilerinin kullandığı yazılımlar
Veri bilimi, Hadoop, Pig, Hive, Spark ve MapReduce ve yapılandırılmış sorgu dili (SQL), Python, Scala ve Perl'in yanı sıra istatistiksel bilgisayar programlama dilleri de dahil olmak üzere birçok önemli veri platformu ve program dillerine hakim olması beklenir.

Veri bilimci, veri analisti karşılaştırması
Veri bilimcinin işi çoğu zaman veri analistinin ki ile karıştırılır ancak birçok beceride örtüşme olduğu halde önemli farklılıklar vardır.

Bir veri analistinin işi şirkete bağlı olarak değişse de, genel olarak veri analistleri verileri toplar, bu verileri işler ve standart istatistiksel araçlar ve teknikler kullanarak istatistiksel analiz gerçekleştirir. Analistler ayrıca, iş süreçlerinde, ürünlerde veya hizmetlerde iyileştirmeler için yeni fırsatları belirlemek için kalıpları belirler ve veri setlerinde korelasyon oluştururlar. Bazı durumlarda, veri analistleri ayrıca büyük veri ve ilişkisel veritabanı sistemlerini tasarlar, oluşturur ve korurlar. Veri analistleri ABD de yılda ortalama 60.000 USD kazanmaktadır.

Veri bilimcileri ise hem veri analistlerinin işlerinden sorumludur hem de bu analizleri makro ve mikro düzeyde algoritmalar geliştirmek için kullanabilirler. Veri bilimcileri, gelişmiş verileri kullanarak büyük verileri analiz edebilecek donanıma sahiptir ve belirli problemler için yeni algoritmalar geliştirmek için araştırma geçmişine sahip olmaları beklenmektedir.

Ayrıca çözülecek özel bir sorun olmaksızın verileri keşfetmekle görevli olabilirler. Bu senaryoda, verileri ve işletmeyi, işletme operasyonlarını, ürünleri, hizmetleri veya müşteri ilişkilerini iyileştirmek amacıyla, soruları formüle edecek ve işletme yöneticilerine kavrayışlar sunacak kadar iyi anlamak gerekir. (www.ihracat.co)


data scientist skills


VERİ BİLİMCİLERİN SAHİP OLMASI GEREKEN BİLGİ VE BECERİLER

1- Veri bilimcileri, Programlama dillerine hakim olmalıdır
Veri Bilimi Becerileri - Programlama – Çalıştığınız şirketin sektörü ne olursa olsun, muhtemelen ticaret araçlarını nasıl kullanacağınızı bilmeniz beklenir. Bu sebeple örneğin Python gibi istatistiksel bir programlama dili ve SQL gibi bir veritabanı programını kullanabiliyor olmanız gerekmektedir.

2- Veri bilimcileri, İstatistik konusunda bilgili olmalı
Veri bilimci olarak istatistiklerin iyi bir şekilde anlaşılması hayati öneme sahiptir. İstatistiksel testler, dağılımlar, maksimum olasılık tahmincileri, vb. konulara aşina olmalısınız. Bu, aynı zamanda makine öğrenimi için de geçerlidir, ancak istatistik bilgilerinizin en önemli yönlerinden biri, farklı tekniklerin ne zaman (veya değil) geçerli bir yaklaşım. İstatistikler, tüm şirket türlerinde önemlidir, ancak paydaşların kararlarını vermek ve deneyleri tasarlamak / değerlendirmek için yardımınıza bağlı olduğu özellikle veri odaklı şirketler önemlidir.

3- Veri bilimcileri, Makine öğrenme becerilerine sahip olmalıdır
Özellikle büyük miktarda veri içeren bir şirkette veya ürünün kendisinin özellikle veri odaklı olduğu bir şirkette (örn. Bilişim, medya, reklam, pazarlama firmaları) çalışıyorsanız, makine öğrenme yöntemlerine aşina olmanız gerekmektedir. Bu tekniklerden birçoğunun R veya Python kütüphaneleri kullanılarak uygulanabileceği doğrudur bu nedenle, algoritmaların nasıl çalıştığına dair bir uzman olmak zorunlu değildir. Veri bilimcisinin farklı teknikleri kullanmanın ne zaman uygun ve gerekli olduğunu biliyor olması bu işteki başarı kriterini belirler.
Makine öğrenme nedir: Makine öğrenimi, yazılım uygulamalarının net olarak programlanmadan sonuçların tahmininde daha doğru olmasını sağlayan yapay zeka (AI) bir türüdür. Makine öğreniminin temel önceliği, giriş verilerini alabilen ve bir çıktı değerini kabul edilebilir bir aralıkta öngörmek için istatistiksel analizi kullanabilen algoritmalar oluşturmaktır.

4- Veri bilimcileri, Çok Değişkenli Analiz yapabilmeli ve Lineer Cebir bilmeli
Bu kavramları anlamak, ürünün veriyle tanımlandığı şirketlerde çok önemlidir ve tahmini performansdaki veya algoritma optimizasyonundaki küçük gelişmeler şirket için büyük kazanımlara neden olabilir.


Bir veri bilimi rolüyle ilgili bir röportajda, başka yerde çalıştığınız makine öğrenimi veya istatistik sonuçlarından bazılarını türetmeniz istenebilir. Veya görüşmeci, bu tekniklerin temelini oluşturduğu için, temel çok değişkenli hesap veya doğrusal cebir sorularını isteyebilir.

Python veya R'de çok sayıda kutu uygulaması olduğunda, bir veri bilimcisinin bunu neden anlaması gerektiğini merak edebilirsiniz. Yanıt, belli bir noktada bir veri bilim ekibinin, bir yazılım oluşturması veya geliştirmesi beklenebilir. (www.ihracat.co)

5- Veri bilimcileri, Veri kusurları ve eksiklilkleri ile başedebilmeli
Analiz edeceğiniz veriler çok dağınık ve/veya çok geniş bir alanı kapsıyor olabilir. Bu nedenle, verilerdeki eksiklik ve kusurlarla nasıl başa çıkacağını bilmek gerçekten önemlidir. Veri kusurlarına örnek olarak, eksik değerler, tutarsız dize biçimi, tarih biçimlendirmesi, unix zamanı, zaman damgaları vs..

6- Veri bilimcileri, Veri Görselleştirme ve İletişim tekniklerine hakim olmalı
Veri bilimcileri, elde ettikleri bulguları, ilgili kişi ve birimlere aktarırken, doğru iletişim ve görselleme tekniklerini kullanmalı, bu aşamada, elde ettikleri verilerin nasıl algılanacağını nasıl gözlemleneceğini öngörüyor olmaları beklenir.

Görselleştirme açısından, matplotlib, ggplot veya d3.j gibi veri görselleştirme araçlarını tanımak son derecede yardımcı olabilir. Sadece verileri görselleştirmek için gerekli olan araçları değil, aynı zamanda görsel olarak veri şifreleme ve bilgi iletişiminde kullanılan ilkeleri de bilmek önemlidir.

7- Veri bilimcileri ve Yazılım Mühendisliği
Özellikle küçük bir şirkette, tek başına veya küçük bir ekiple çalışan firmaların öncelikli tercihi, yazılım mühendisliği kökenli bir veri bilimciyle çalışmak olacaktır. Program kullanma ve geliştirme becerilerinin yardımı olmadan bir sürü veri günlüğü ile potansiyel olarak veri odaklı ürünlerin geliştirilmek zor olacaktır. Veri bilişimini faaliyet alanı olarak seçen firmalarda ya da veri bilişimi için ekip kuran firmalarda, veri bilimcilerin matematik, istatistik, pazarlama gibi farklı meslek kökenlerinden uzmanları da içermesi faydalı olacaktır.

8- Veri bilimcileri Veri Sezgisi
İşverenler, veri bilimcilerinin, veri odaklı bir problem çözücü olduğunu görmek istiyorlar. Veri bilimcileri bir iş mülakatında ya da veribilimi ve analizine yönelik başka bir firmadan gelen bir iş talebinde Görüşme sürecindeki bir noktada, şirketin geliştirmeyi istediği veri odaklı ürüne yönelik bir soru yöneltebilirler. 

Önemli olan, size sunulan rakamlar ve teknik detaylar hakkında sezgilerinizin kuvvetli olması. Hem müşterilerin, hem çalıştığınız departmanalrın talep ve beklentilerini anlayabilmenizdir. Veri bilimcisi olarak, mühendisler ve ürün yöneticileri ile nasıl etkileşim kurmalısınız? Hangi yöntemleri kullanmalısınız? Yaklaşımlar ne zaman mantıklı olur? (www.ihracat.co)




Hiç yorum yok:

Yorum Gönder