(ธันวาคม 12, 2022) ในช่วงปีมัธยมปลายที่ Northwest Guilford High School Neil Shah เริ่มมองหาโอกาสที่จะมีส่วนร่วมในการวิจัยวิทยาการคอมพิวเตอร์ เขาส่งอีเมลถึงอาจารย์หลายคนที่กำลังมองหาโอกาสที่จะช่วยพวกเขาในการค้นคว้า แม้จะฟรีก็ตาม
นีล มีประสบการณ์และทักษะในการเขียนโปรแกรม และปรารถนาที่จะเรียนรู้ แต่ไม่มีปริญญาหรือการฝึกอบรมขั้นสูง ในที่สุด ศาสตราจารย์ Nagiza Samatova แห่ง NC State University ได้ตอบกลับอีเมลของเขา และลงเอยด้วยการใช้เวลาช่วงฤดูร้อนช่วยนักศึกษาระดับบัณฑิตศึกษาทำโครงการวิจัย
“ประสบการณ์นี้ช่วยให้ฉันค้นพบว่าฉันมีความหลงใหลในการเจาะลึกปัญหา ฉันสนุกกับการใช้สมองกับปัญหาหนึ่งเป็นเวลานาน และอาการโรคประสาทนี้ก็ช่วยฉันได้อย่างดีทั้งตอนนี้และตอนนี้” นีล ชาห์ยิ้ม ผู้ซึ่งตอนนี้เป็นหัวหน้านักวิทยาศาสตร์การวิจัยที่ Snap Inc. ซีแอตเติล ผู้ซึ่งทำงานอย่างกว้างขวางครอบคลุมการทำเหมืองข้อมูล การเรียนรู้ของเครื่อง วิทยาศาสตร์เครือข่ายและโดเมนสังคมศาสตร์การคำนวณ ในช่วงหลายปีที่ผ่านมา งานวิจัยที่กว้างขวางของเขาส่งผลให้มีการตีพิมพ์ในวารสารมากกว่า 45 ฉบับ นอกเหนือจากรางวัลกระดาษที่ดีที่สุด
ชีวิตผู้อพยพ
นีลพ่อแม่ของย้ายจากมุมไบไปสหรัฐอเมริกาเมื่ออายุประมาณ 30 ปี และเขาอายุได้ XNUMX ขวบครึ่ง พ่อของเขาทำงานเป็นผู้อำนวยการ Global Customs Compliance ที่บริษัทสิ่งทอ ในขณะที่แม่ของเขาเป็น Staff Software Quality Assurance Engineer ที่บริษัทผลิตตู้จ่ายน้ำมัน
“พ่อแม่ของฉันเป็นผู้อพยพรุ่นแรก และพวกเขาทำงานหนักเพื่อสร้างชีวิตให้ฉันในประเทศนี้ พวกเขาปลูกฝังค่านิยมที่ยิ่งใหญ่ในตัวฉัน โดยเฉพาะอย่างยิ่งจรรยาบรรณในการทำงานที่แข็งแกร่ง ความซื่อสัตย์ และความพากเพียร” เขาเล่าด้วย โกลบอลอินเดียน. ในช่วงสองสามปีแรก ตระกูล Shah อาศัยอยู่ในราลี นอร์ทแคโรไลนา สหรัฐอเมริกา และต่อมาย้ายไป เมืองกรีนส์โบโร ที่นีลจบการศึกษาระดับมัธยมปลายในที่สุด ที่บ้าน เขาสนุกกับการเล่นวิดีโอเกม ท่องอินเทอร์เน็ต และค้นหาบทเรียนเพื่อเรียนรู้วิธีการเขียนโปรแกรมซอฟต์แวร์ ฯลฯ ในโรงเรียนมัธยม โรงเรียนของเขากำหนดให้นักเรียนซื้อเครื่องคำนวณกราฟ TI-83+ เพื่อช่วยให้พวกเขาเรียนรู้แนวคิดบางอย่างเกี่ยวกับพีชคณิต/เรขาคณิต
ขั้นตอนแรกในฐานะ coder
หนึ่งในประสบการณ์จริงจังในการเขียนโปรแกรมครั้งแรกของเขาคือการใช้ภาษาโปรแกรมง่ายๆ ที่เครื่องคิดเลขเหล่านี้มี เพื่อเขียนซอฟต์แวร์พื้นฐานทางคณิตศาสตร์และวิทยาศาสตร์ “ฉันเคยเขียนเกมสไตล์ “เลือกการผจญภัยของคุณเอง” (CYOA) แบบง่ายๆ บน TI-83+ ด้วย” ชายวัย 30 ปี ผู้ชื่นชอบการสร้างเครื่องมือใหม่ๆ กล่าว
ที่น่าสนใจคือ ความร่วมมือระหว่างเขากับศาสตราจารย์ Nagiza ซึ่งเขาได้ร่วมงานด้วยเมื่อสมัยเรียนมัธยมปลายยังคงดำเนินต่อไปอีกหลายปีหลังจากนั้น เขายังทำงานร่วมกับ Katie ลูกสาวของ Nagiza (สมัยมัธยมปลายด้วย) ในการแข่งขันงานวิจัยที่สำคัญสำหรับนักเรียนมัธยมปลาย
“Nagiza และเพื่อนร่วมงานของเธอ Prof. Anatoli Melechko ให้คำปรึกษาแก่เราเกี่ยวกับโครงการในการระบุความไม่เสถียรในพลาสมาในข้อมูลเครื่องปฏิกรณ์นิวเคลียร์ฟิวชันจำลองด้วยคอมพิวเตอร์ ซึ่งจบลงด้วยการที่เราได้รับรางวัล 50 ดอลลาร์ในฐานะทีม (ระหว่างฉันกับ Katie คนละ 25 ดอลลาร์) และช่วยเหลือ เราจ่ายค่าเล่าเรียนระดับปริญญาตรี” นีลยิ้ม ผู้ซึ่งเข้าร่วม NC State เพื่อศึกษาระดับปริญญาตรีหลังจากจบมัธยมปลาย
การทำเหมืองข้อมูล
ขณะที่เขาทำวิจัยที่ NC State University นีลยังได้ทำงานเกี่ยวกับการจัดการและการบีบอัดข้อมูล กล่าวคือ วิธีจัดการการจัดเก็บและการจัดทำดัชนีชุดข้อมูลขนาดใหญ่มาก
แง่มุมหนึ่งที่น่าสนใจอย่างยิ่งของการทำเหมืองข้อมูลและการเรียนรู้ของเครื่องคือข้อมูลจำนวนมากที่สร้างขึ้นในปัจจุบันมีลักษณะเป็นสังคม ซึ่งผมหมายความว่าข้อมูลดังกล่าวสะท้อนถึงพฤติกรรมและการกระทำของมนุษย์ ตัวอย่างเช่น วิธีที่มนุษย์โต้ตอบกัน หรือวิธีที่พวกเขาเลือกที่จะใช้เวลาดูวิดีโอออนไลน์หรือมีส่วนร่วมกับเนื้อหา
“ปฏิสัมพันธ์ประเภทนี้สร้างข้อมูลที่มีค่ามหาศาลซึ่งสรุปข้อมูลโดยพื้นฐานเกี่ยวกับพฤติกรรมของมนุษย์ ข้อมูลนี้สามารถใช้เป็นเลนส์ในการทำความเข้าใจผู้คนซึ่งเป็นจุดสนใจหลักของระเบียบวินัยทางสังคมศาสตร์การคำนวณ” เขากล่าวว่าการเข้าใจว่าพฤติกรรมของมนุษย์สามารถคาดเดาได้และมีระเบียบเป็นสิ่งที่เข้าใจได้อย่างมากสำหรับเขา นีลสำเร็จการศึกษาวิทยาศาสตรบัณฑิตสาขาวิทยาการคอมพิวเตอร์และวิชาโทสาขาคณิตศาสตร์ในปี 2013
ปริญญาเอกจากมช
นีล ใช้เวลากว่าสี่ปีเล็กน้อยที่ Carnegie Mellon University ซึ่งเขาศึกษาต่อในระดับปริญญาเอก (ตั้งแต่ปี 2013 – 2017) ทันทีหลังจากสำเร็จการศึกษาจาก NC State University
“งานของฉันที่ CMU มุ่งเน้นไปที่การทำความเข้าใจและสร้างแบบจำลองข้อมูลกราฟขนาดใหญ่ โดยเฉพาะในบริบทของการระบุพฤติกรรมที่ผิดปกติ น่าสงสัย หรือไม่เหมาะสมในโซเชียลเน็ตเวิร์กและแพลตฟอร์มออนไลน์” นีลอธิบาย
เนื่องจากการรับรู้ทางออนไลน์มีความสำคัญอย่างยิ่งต่อความประทับใจของเราที่มีต่อแบรนด์ออนไลน์ ผู้มีอิทธิพล และผู้ค้า มีสิ่งจูงใจทางการเงินและสังคมมากมายที่จะจัดการกับการรับรู้นี้ เช่น โดยการซื้อผู้ติดตามปลอมบนแพลตฟอร์มโซเชียล รีวิวปลอมเกี่ยวกับการจัดอันดับและอีคอมเมิร์ซ แพลตฟอร์มนักวิทยาศาสตร์วิจัยกล่าว
นีลวิทยานิพนธ์ของมุ่งเน้นไปที่วิธีการค้นหาพฤติกรรมที่ชั่วร้ายดังกล่าวโดยอัตโนมัติในชุดข้อมูลกราฟขนาดใหญ่โดยการระบุรูปแบบการโต้ตอบที่ผิดปกติในกราฟเหล่านี้ ซึ่งถูกทิ้งไว้เป็นร่องรอยของพฤติกรรมเหล่านี้ สิ่งเหล่านี้ถูกใช้ในระบบที่ปรับใช้ที่ Google, Flipkart และ กระตุกและอื่น ๆ
หลังจากปกป้องปริญญาเอกของเขาในเดือนตุลาคม 2017 Neil ได้ทำงานร่วมกับ Prof Srijan Kumar ผู้เชี่ยวชาญด้านไซเบอร์สเปซที่มีชื่อเสียง เพื่อเขียนบทความสำรวจในหัวข้อ “ข้อมูลเท็จบนเว็บไซต์และโซเชียลมีเดีย” ให้ภาพรวมของงานวิชาการที่เกี่ยวข้องมากมายในหัวข้อเหล่านี้ งานนี้ได้รับการอ้างถึงมากกว่า 370 ครั้งในช่วงไม่กี่ปีที่ผ่านมา
ที่ทำงาน
เขาเข้าร่วม Snap ไม่นานหลังจากจบปริญญาเอกในช่วงปลายปี 2017 เขาเป็นผู้นำการริเริ่มในกราฟ ML และจัดการทีมนักวิทยาศาสตร์ วิศวกร และนักวิจัยฝึกหัดเพื่อพัฒนาวิธีการกราฟ ML ที่ล้ำสมัย
ทีมของฉันทำงานทั้งการเปิดใช้งานแอปพลิเคชันภายในของวิธีการ ML แบบกราฟกับปัญหาทางธุรกิจ (แบบจำลองคำแนะนำและการจัดอันดับ) รวมถึงการวิจัยที่มีผลกระทบซึ่งมองเห็นได้จากภายนอก เข้าถึงได้ (เช่น ในการประชุมชั้นนำ) และโอเพ่นซอร์ส
งานของเขาส่วนใหญ่มุ่งเน้นไปที่เทคนิคการเรียนรู้ของเครื่องบนข้อมูลกราฟ ไปจนถึงการประยุกต์ใช้การสร้างแบบจำลองพฤติกรรมของผู้ใช้บนข้อมูลโซเชียลเน็ตเวิร์ก ซึ่งรวมถึงการปรับปรุงประสบการณ์ของผู้ใช้โดยการตรวจจับผู้ใช้ปลอม การกระทำที่ฉ้อฉล และสแปม ตลอดจนระบบการจัดอันดับและคำแนะนำที่ดีขึ้น
กราฟ ML
“กราฟ” เป็นโครงสร้างพื้นฐานของข้อมูลในวิทยาการคอมพิวเตอร์ซึ่งเป็นตัวแทนของออบเจกต์ (เรียกว่าโหนดหรือจุดยอด) ที่มีปฏิสัมพันธ์ระหว่างกัน (เรียกว่าเอดจ์) Graph ML เป็นสาขาหนึ่งของ Machine Learning ซึ่งพยายามทำความเข้าใจกับข้อมูลเชิงสัมพันธ์ที่เข้ารหัสในโครงสร้างกราฟ เพื่อนำไปใช้กับแอปพลิเคชันต่างๆ เช่น การสร้างแบบจำลองและการทำนายพฤติกรรมบนกราฟ (เช่น บุคคลจะทำอะไรในอนาคต คนหรือวัตถุใดที่พวกเขาจะโต้ตอบ กับ?)
การวิจัยศึกษา
นีลเป็นนักวิจัยที่มีผลงานมากมาย มีผลงานและสิ่งพิมพ์มากมายให้เครดิตของเขา ตัวอย่างเช่น ที่ Twitch ซึ่งเป็นแพลตฟอร์มสตรีมมิงแบบสดยอดนิยมที่ช่วยให้ผู้ที่ชื่นชอบการเล่นเกมสามารถค้นหาเกมและผู้สร้างเนื้อหาได้ เขาช่วยจัดการกับปัญหา "viewbotting" ที่สำคัญ สตรีมเมอร์จ่ายเงินให้ผู้ให้บริการบ็อตเน็ตเพื่อเพิ่มเมตริกผู้ชม ผลงานของนีลได้รับการเผยแพร่ที่ TheWebConf2017
ใน Microsoft นีลและทีมของเขาได้สร้าง Microsoft Academic Graph โดยวัดผลกระทบของการวิจัยทางวิทยาศาสตร์ในรูปแบบที่นอกเหนือไปจากเมตริกที่อิงตามการนับอย่างง่าย เช่น จำนวนการอ้างอิง ดัชนี h และปัจจัยผลกระทบของวารสาร เขากล่าว ในการฝึกงานครั้งแรกที่ Lawrence Livermore National Laboratory เขาทำงานเพื่อระบุและสรุปรูปแบบพฤติกรรมโดยอัตโนมัติในชุดข้อมูลกราฟที่เปลี่ยนแปลงตามเวลา เขายังทำงานเพื่อระบุข้อมูลที่ไม่ถูกต้องจากภาพหน้าจอของเว็บไซต์ในข้อมูล Twitter
ทุนการศึกษา
นีล รอดพ้นจากความท้าทายทางการเงินที่สำคัญเนื่องจากมีทุนการศึกษาค่อนข้างน้อย เขาสามารถหักกลบต้นทุนการศึกษาก้อนโตของเขาได้โดยการทำวิจัยระดับปริญญาตรีที่ NC State University และได้รับวิทยาศาสตรบัณฑิตสาขาวิทยาการคอมพิวเตอร์โดยไม่มีหนี้สินใดๆ
นีล กล่าวว่าเขาโชคดีที่ได้รับปริญญาเอก "ฟรี" เมื่อพิจารณาจากวิธีการทำงานของโปรแกรม CS ของมหาวิทยาลัย Carnegie Mellon “การวิจัยและค่าจ้างของฉันที่นี่ยังได้รับการสนับสนุนจาก NSF Graduate Research Fellowship ซึ่งช่วยให้ฉันสามารถรักษามาตรฐานการครองชีพที่เหมาะสมในขณะที่เรียน” เขากล่าว
แผนการในอนาคต
“ฉันต้องการทำวิจัยต่อในอุตสาหกรรม ฉันรักการเรียนรู้และพัฒนาตนเองอย่างต่อเนื่อง” นีลกล่าว การช่วยให้ผู้อื่นเข้าใจวิธีคิดเกี่ยวกับผลกระทบของปัญหา วิธีแยกย่อยออกเป็นขั้นตอนที่บรรลุผลได้ และยืนหยัดจนกว่าพวกเขาจะสามารถมีส่วนร่วมในนวัตกรรมทางวิทยาศาสตร์ และการได้เห็นความสำเร็จและการเติบโตในระยะยาวถือเป็นรางวัลอย่างมากสำหรับนีล
ในยามว่าง…
“ฉันชอบอ่านหนังสือ ยกน้ำหนัก และเล่นวิดีโอเกม” นีลผู้ซึ่งกำลังอ่านหนังสือของสตีเฟน คิงอยู่สองสามเล่มเมื่อเร็วๆ นี้กล่าว เขายกน้ำหนักมาหลายปีแล้ว “ฉันเคยแข่งขันยกน้ำหนักตอนที่ฉันเรียนปริญญาโท” นีลผู้ซึ่งพบว่าเป็นกิจกรรมบำบัดและโดดเดี่ยวหลังจากครุ่นคิดมาทั้งวัน เขายังสามารถใช้เวลาหลายชั่วโมงในการเล่น Starcraft 2 และ Dota 2 ซึ่งเป็นอีสปอร์ตที่ใหญ่ที่สุดสองรายการ
- ติดตาม นีล ชาห์ ได้ที่ LinkedIn