(Disember 12, 2022) Semasa tahun sekolah menengahnya di Northwest Guilford High School, Neil Shah mula mencari peluang untuk melibatkan diri dalam Penyelidikan Sains Komputer. Dia menghantar e-mel kepada ramai profesor mencari peluang untuk membantu mereka dengan penyelidikan mereka, walaupun secara percuma.
Neil mempunyai pengalaman dan kemahiran pengaturcaraan, dan keinginan untuk belajar, tetapi tiada ijazah atau latihan lanjutan. Akhirnya, seorang profesor di NC State University Prof. Nagiza Samatova membalas e-melnya, dan dia akhirnya menghabiskan musim panas membantu pelajar siswazahnya dengan projek penyelidikan mereka.
“Pengalaman ini membantu saya mengetahui bahawa saya mempunyai semangat yang sebenar untuk mendalami masalah. Saya suka memecahkan otak saya mengenai satu masalah untuk masa yang lama dan neurotikisme ini memberi saya manfaat dengan baik, dahulu dan sekarang, "senyum Neil Shah, yang kini Ketua Saintis Penyelidikan di Snap Inc., Seattle, yang kerjanya merangkumi perlombongan data, pembelajaran mesin secara meluas. , domain sains rangkaian dan sains sosial pengiraan. Selama bertahun-tahun, penyelidikannya yang meluas telah menghasilkan 45 + penerbitan jurnal selain anugerah kertas terbaik.
Kehidupan pendatang
NeilIbu bapa 's berpindah dari Mumbai ke AS ketika mereka berumur kira-kira 30 tahun, dan dia berumur satu setengah tahun. Bapanya bekerja sebagai Pengarah, Pematuhan Kastam Global di sebuah syarikat tekstil, manakala ibunya ialah Jurutera Jaminan Kualiti Perisian Kakitangan di sebuah syarikat pembuatan dispenser bahan api.
“Ibu bapa saya adalah pendatang generasi pertama, dan mereka bekerja keras untuk membina kehidupan untuk saya di negara ini. Mereka menanamkan nilai-nilai yang hebat dalam diri saya, terutamanya etika kerja yang kuat, integriti, dan ketekunan,” kongsinya dengan India Global. Untuk beberapa tahun pertama, keluarga Shah tinggal di Raleigh, NC, AS dan kemudiannya berpindah ke Greensboro, tempat Neil akhirnya lulus dari sekolah menengah. Di rumah, dia gemar bermain permainan video, melayari internet dan mencari tutorial untuk mempelajari cara memprogram perisian, dsb. Di sekolah menengah, sekolahnya memerlukan pelajar membeli kalkulator grafik TI-83+ untuk membantu mereka mempelajari beberapa konsep dalam algebra / geometri.
Langkah pertama sebagai pengekod
Salah satu pengalaman serius pertamanya memasuki pengaturcaraan ialah menggunakan bahasa pengaturcaraan mudah yang dimiliki oleh kalkulator ini, untuk menulis perisian matematik dan sains asas. "Saya juga pernah menulis permainan gaya "pilih pengembaraan anda sendiri" (CYOA) yang ringkas pada TI-83+," kata lelaki berusia 30 tahun itu, yang gemar mencipta alatan baharu.
Menariknya, kerjasamanya dengan Prof Nagiza, yang dikaitkan dengannya semasa sekolah menengah, berterusan selama bertahun-tahun selepas itu. Dia juga bekerja dengan anak perempuan Nagiza, Katie, (juga di sekolah menengah) dalam pertandingan penyelidikan utama untuk pelajar sekolah menengah.
“Nagiza dan rakan sekerjanya Prof. Anatoli Melechko membimbing kami dalam projek ke arah mengenal pasti ketidakstabilan dalam plasma dalam data reaktor gabungan nuklear simulasi komputer, yang berakhir dengan kami memenangi $50K sebagai satu pasukan ($25K setiap satu antara saya dan Katie), dan membantu kami membayar untuk persekolahan prasiswazah,” senyum Neil, yang kemudiannya menyertai NC State untuk persekolahan prasiswazah selepas menamatkan sekolah menengah.
perlombongan data
Semasa dia membuat penyelidikan di NC State University, Neil juga mengusahakan pengurusan dan pemampatan data - iaitu, cara mengendalikan penyimpanan dan pengindeksan set data yang sangat besar.
Satu aspek yang sangat menarik dalam perlombongan data dan pembelajaran mesin ialah sejumlah besar data yang dijana hari ini bersifat sosial, yang saya maksudkan ia mencerminkan tingkah laku dan tindakan manusia. Contohnya, cara manusia berinteraksi antara satu sama lain, atau cara mereka memilih untuk menghabiskan masa mereka menonton video dalam talian atau melibatkan diri dengan kandungan.
"Jenis interaksi ini mencipta data yang sangat berharga yang secara asasnya merangkumi maklumat tentang cara manusia berkelakuan. Data ini boleh digunakan sebagai lensa untuk memahami orang, yang merupakan fokus utama disiplin sains sosial pengiraan." Dia berkata memahami bahawa tingkah laku manusia mempunyai kebolehramalan dan ketertiban adalah sesuatu yang sangat mencerahkan baginya. Neil lulus dengan BS dalam Sains Komputer dan Minor dalam Matematik pada 2013.
PhD dari CMU
Neil menghabiskan lebih sedikit empat tahun di Carnegie Mellon University, tempat beliau melanjutkan pengajian PhD (dari 2013 – 2017), serta-merta selepas menamatkan pengajian dari NC State University.
"Kerja saya di CMU tertumpu pada pemahaman dan pemodelan data graf berskala besar, khususnya dalam konteks mengenal pasti tingkah laku anomali, mencurigakan atau kesat dalam rangkaian sosial dan platform dalam talian," jelas Neil.
Memandangkan persepsi dalam talian sangat kritikal terhadap tanggapan kami terhadap jenama dalam talian, pengaruh dan pedagang, terdapat insentif kewangan dan sosial yang besar untuk memanipulasi persepsi ini, contohnya, dengan membeli pengikut palsu di platform sosial, ulasan palsu pada penarafan dan e-dagang platform, kata saintis penyelidikan itu.
NeilTesis memfokuskan pada kaedah untuk menemui gelagat jahat tersebut secara automatik dalam set data graf berskala besar dengan mengenal pasti corak interaksi anomali dalam graf ini yang ditinggalkan sebagai kesan gelagat ini. Ini telah digunakan dalam sistem yang digunakan di Google, Flipkart dan Twitch, dan banyak lagi.
Selepas mempertahankan PhDnya pada Oktober 2017, Neil bekerja dengan pakar ruang Siber terkenal Prof Srijan Kumar, untuk menulis kertas tinjauan bertajuk "Maklumat Palsu di Web dan Media Sosial." Ia memberikan gambaran keseluruhan kepelbagaian besar karya akademik yang berkaitan mengenai topik ini. Karya ini telah dipetik lebih 370 kali dalam beberapa tahun kebelakangan ini.
Di tempat kerja
Beliau menyertai Snap sejurus selepas menamatkan PhDnya, menjelang penghujung tahun 2017. Beliau mengetuai inisiatif dalam graf ML dan menguruskan pasukan saintis, jurutera dan pelatih penyelidikan ke arah pembangunan kaedah ML graf terkini.
Pasukan saya bekerja pada kedua-dua mendayakan aplikasi dalaman kaedah ML graf kepada masalah perniagaan (model pengesyoran dan kedudukan), serta penyelidikan berkesan yang boleh dilihat secara luaran, boleh diakses (cth di persidangan teratas) dan sumber terbuka.
Kerja beliau kebanyakannya menumpukan pada teknik pembelajaran mesin pada data graf, ke arah aplikasi pemodelan tingkah laku pengguna pada data rangkaian sosial. Ini termasuk meningkatkan pengalaman pengguna dengan mengesan pengguna palsu, tindakan penipuan dan spam, serta memperbaiki sistem kedudukan dan pengesyoran.
Graf ML
"Graf" ialah struktur data asas dalam sains komputer yang mewakili objek (dipanggil nod atau bucu) yang berinteraksi antara satu sama lain (dipanggil tepi). Graph ML ialah cabang Pembelajaran Mesin yang bertujuan untuk memahami data hubungan ini yang dikodkan dalam struktur graf, terhadap aplikasi seperti pemodelan dan meramalkan gelagat pada graf (cth. Apakah yang akan dilakukan oleh seseorang pada masa hadapan? Orang atau objek lain yang manakah akan mereka berinteraksi dengan?)
penyelidikan
Seorang penyelidik prolifik, Neil mempunyai senarai panjang kerja dan penerbitan untuk kreditnya. Di Twitch, contohnya, platform penstriman langsung yang popular yang membolehkan peminat permainan mencari pencipta permainan dan kandungan, dia membantu menangani masalah "viewbotting" utama. Penstrim membayar penyedia botnet untuk meningkatkan metrik tontonan. Kerja Neil telah diterbitkan di TheWebConf2017.
Dalam Microsoft, Neil dan pasukannya membina Graf Akademik Microsoft, mengukur kesan penyelidikan saintifik dengan cara yang melangkaui metrik berasaskan kiraan mudah seperti kiraan petikan, indeks h dan faktor impak jurnal, katanya. Pada latihan pertamanya, di Lawrence Livermore National Laboratory, beliau berusaha untuk mengenal pasti dan meringkaskan corak tingkah laku secara automatik dalam set data graf yang berkembang masa. Beliau juga telah berusaha untuk mengenal pasti Maklumat Salah daripada Tangkapan Skrin Laman Web dalam data Twitter.
Biasiswa
Neil telah terhindar daripada cabaran kewangan utama kerana beberapa biasiswa. Dia dapat mengimbangi sebahagian besar kos persekolahannya dengan mengikuti penyelidikan sarjana muda di NC State University, memperoleh BS dalam Sains Komputer tanpa sebarang hutang.
Neil berkata dia bertuah kerana mendapat PhD "secara percuma," memandangkan program CS Universiti Carnegie Mellon beroperasi. "Penyelidikan dan gaji saya di sini juga disokong oleh NSF Graduate Research Fellowship, yang membolehkan saya mengekalkan taraf hidup yang munasabah semasa saya belajar," katanya.
Rancangan masa depan
“Saya ingin meneruskan penyelidikan dalam industri. Saya suka sentiasa belajar dan memperbaiki diri saya secara berperingkat,” kata Neil. Membantu orang lain memahami cara berfikir tentang kesan masalah, cara memecahkannya kepada langkah-langkah yang boleh dicapai, dan berterusan sehingga mereka dapat menyumbang kepada inovasi saintifik dan melihat kejayaan dan pertumbuhan jangka panjang mereka memberi ganjaran yang sangat besar untuk Neil.
Dalam masa lapang…
“Saya gemar membaca, mengangkat berat dan bermain permainan video,” kata Neil, yang membaca beberapa buku Stephen King kebelakangan ini. Dia telah mengangkat berat selama bertahun-tahun sekarang. "Saya pernah bersaing dalam powerlifting ketika saya di sekolah siswazah," kata Neil, yang mendapati ia merupakan aktiviti terapeutik dan menyendiri selepas seharian berfikir. Dia juga boleh menghabiskan berjam-jam bermain Starcraft 2 dan Dota 2, dua daripada e-sukan terbesar.
- Ikuti Neil Shah LinkedIn