(Ngày 12 tháng 2022 năm XNUMX) Trong những năm trung học tại Trường Trung học Tây Bắc Guilford, Neil Shah bắt đầu tìm kiếm cơ hội tham gia Nghiên cứu Khoa học Máy tính. Anh ấy đã gửi email cho nhiều giáo sư để tìm kiếm cơ hội giúp họ nghiên cứu, thậm chí là miễn phí.
Neil có kinh nghiệm và kỹ năng lập trình, và mong muốn học hỏi, nhưng không có bằng cấp hoặc đào tạo nâng cao. Cuối cùng, một giáo sư tại Đại học Bang NC, Giáo sư Nagiza Samatova, đã trả lời email của anh ấy và cuối cùng anh ấy đã dành một mùa hè để giúp các sinh viên cao học của cô ấy thực hiện các dự án nghiên cứu của họ.
“Trải nghiệm này đã giúp tôi khám phá ra rằng tôi có niềm đam mê thực sự trong việc đi sâu vào các vấn đề. Tôi rất thích vắt óc suy nghĩ về một vấn đề trong một thời gian dài và chứng loạn thần kinh này đã giúp tôi rất nhiều, từ đó đến bây giờ,” Neil Shah cười, hiện là Nhà khoa học nghiên cứu chính tại Snap Inc., Seattle, người có công việc mở rộng về khai thác dữ liệu, máy học , khoa học mạng và các lĩnh vực khoa học xã hội tính toán. Trong những năm qua, nghiên cứu sâu rộng của ông đã tạo ra hơn 45 ấn phẩm trên tạp chí bên cạnh các giải thưởng bài báo hay nhất.
Cuộc sống di dân
NeilCha mẹ của anh ấy chuyển từ Mumbai đến Mỹ khi họ khoảng 30 tuổi và anh ấy mới một tuổi rưỡi. Cha anh là Giám đốc Tuân thủ Hải quan Toàn cầu tại một công ty dệt may, trong khi mẹ anh là Kỹ sư Đảm bảo Chất lượng Phần mềm Nhân viên tại một công ty sản xuất bình xăng.
“Cha mẹ tôi là thế hệ nhập cư đầu tiên, và họ đã làm việc chăm chỉ để xây dựng cuộc sống cho tôi ở đất nước này. Họ thấm nhuần những giá trị tuyệt vời trong tôi, đặc biệt là đạo đức làm việc mạnh mẽ, tính chính trực và sự kiên trì,” anh chia sẻ với Ấn Độ toàn cầu. Trong vài năm đầu tiên, gia đình Shah sống ở Raleigh, NC, Hoa Kỳ và sau đó chuyển đến Greensboro, nơi Neil tốt nghiệp trung học. Ở nhà, anh ấy thích chơi trò chơi điện tử, duyệt internet và tìm hướng dẫn để học cách lập trình phần mềm, v.v. Ở trường cấp hai, trường của anh ấy yêu cầu học sinh mua máy tính vẽ đồ thị TI-83+ để giúp họ học một số khái niệm về đại số/hình học.
Những bước đầu tiên với tư cách là một lập trình viên
Một trong những trải nghiệm nghiêm túc đầu tiên của anh ấy khi tham gia lập trình là sử dụng ngôn ngữ lập trình đơn giản mà những chiếc máy tính này có, để viết phần mềm toán học và khoa học cơ bản. “Tôi cũng từng viết các trò chơi theo phong cách “chọn cuộc phiêu lưu của riêng bạn” (CYOA) đơn giản trên TI-83+,” người đàn ông 30 tuổi, người thích tạo ra các công cụ mới cho biết.
Thật thú vị, sự hợp tác của anh ấy với Giáo sư Nagiza, người mà anh ấy đã kết giao trong những năm trung học, vẫn tồn tại trong nhiều năm sau đó. Anh ấy cũng đã làm việc với con gái của Nagiza, Katie, (cũng đang học trung học) trong một cuộc thi nghiên cứu lớn dành cho học sinh trung học.
“Nagiza và đồng nghiệp của cô ấy, Giáo sư Anatoli Melechko, đã cố vấn cho chúng tôi về một dự án nhằm xác định sự bất ổn định trong plasma trong dữ liệu lò phản ứng tổng hợp hạt nhân được mô phỏng bằng máy tính, kết quả là chúng tôi đã giành được 50 nghìn đô la theo nhóm (25 nghìn đô la mỗi đội giữa tôi và Katie) và giúp đỡ chúng tôi trả tiền học đại học,” Neil mỉm cười, người tiếp tục gia nhập NC State để học đại học sau khi học xong trung học.
Khai thác dữ liệu
Khi nghiên cứu tại Đại học Bang NC, Neil cũng nghiên cứu về quản lý và nén dữ liệu - cụ thể là cách xử lý việc lưu trữ và lập chỉ mục cho các tập dữ liệu rất lớn.
Một khía cạnh đặc biệt hấp dẫn của khai thác dữ liệu và học máy là một lượng lớn dữ liệu được tạo ra ngày nay có bản chất xã hội, ý tôi là nó phản ánh hành vi và hành động của con người. Ví dụ: cách con người tương tác với nhau hoặc cách họ chọn dành thời gian xem video trực tuyến hoặc tương tác với nội dung.
“Những loại tương tác này tạo ra dữ liệu vô cùng quý giá về cơ bản gói gọn thông tin về cách con người cư xử. Dữ liệu này có thể được sử dụng như một lăng kính để hiểu con người, vốn là trọng tâm của ngành khoa học xã hội tính toán.” Anh ấy nói rằng việc hiểu rằng hành vi của con người có thể dự đoán được và có trật tự là điều gì đó cực kỳ khai sáng đối với anh ấy. Neil tốt nghiệp với bằng Cử nhân Khoa học Máy tính và chuyên ngành Toán học nhỏ vào năm 2013.
Tiến sĩ từ CMU
Neil đã dành hơn bốn năm tại Đại học Carnegie Mellon, nơi anh theo đuổi bằng Tiến sĩ (từ 2013 – 2017), ngay sau khi tốt nghiệp Đại học Bang NC.
Neil giải thích: “Công việc của tôi tại CMU tập trung vào việc hiểu và lập mô hình dữ liệu biểu đồ quy mô lớn, đặc biệt trong bối cảnh xác định các hành vi bất thường, đáng ngờ hoặc lạm dụng trong mạng xã hội và nền tảng trực tuyến.
Cho rằng nhận thức trực tuyến rất quan trọng đối với ấn tượng của chúng ta về các thương hiệu, người có ảnh hưởng và người bán trực tuyến, nên có những động cơ xã hội và tài chính to lớn để thao túng nhận thức này, chẳng hạn như bằng cách mua những người theo dõi giả trên nền tảng xã hội, đánh giá giả về xếp hạng và thương mại điện tử nền tảng, nhà khoa học nghiên cứu cho biết.
NeilLuận án của ông tập trung vào các phương pháp tự động khám phá các hành vi bất chính như vậy trong bộ dữ liệu biểu đồ quy mô lớn bằng cách xác định các mẫu tương tác bất thường trong các biểu đồ này để lại dưới dạng dấu vết của các hành vi này. Chúng được sử dụng trong các hệ thống đã triển khai tại Google, Flipkart và Twitch, v.v.
Sau khi bảo vệ bằng Tiến sĩ vào tháng 2017 năm 370, Neil đã làm việc với chuyên gia không gian mạng nổi tiếng, Giáo sư Srijan Kumar, để viết một bài báo khảo sát có tiêu đề “Thông tin sai lệch trên Web và mạng xã hội”. Nó cung cấp một cái nhìn tổng quan về rất nhiều công trình học thuật có liên quan về các chủ đề này. Công việc này đã được trích dẫn hơn XNUMX lần trong vài năm qua.
Tại nơi làm việc
Anh ấy gia nhập Snap ngay sau khi hoàn thành bằng Tiến sĩ, vào cuối năm 2017. Anh ấy lãnh đạo các sáng kiến về ML đồ thị và quản lý một nhóm gồm các nhà khoa học, kỹ sư và thực tập sinh nghiên cứu nhằm phát triển các phương pháp ML đồ thị tiên tiến nhất.
Nhóm của tôi làm việc trên cả việc kích hoạt các ứng dụng nội bộ của phương pháp ML đồ thị cho các vấn đề kinh doanh (mô hình đề xuất và xếp hạng), cũng như nghiên cứu có tác động có thể nhìn thấy bên ngoài, có thể truy cập được (ví dụ: tại các hội nghị hàng đầu) và nguồn mở.
Công việc của anh chủ yếu tập trung vào kỹ thuật máy học trên dữ liệu đồ thị, hướng tới các ứng dụng mô hình hóa hành vi người dùng trên dữ liệu mạng xã hội. Điều này bao gồm cải thiện trải nghiệm người dùng bằng cách phát hiện người dùng giả mạo, hành động lừa đảo và thư rác, cũng như cải thiện hệ thống xếp hạng và đề xuất.
ML đồ thị
“Đồ thị” là một cấu trúc dữ liệu cơ bản trong khoa học máy tính đại diện cho các đối tượng (được gọi là các nút hoặc đỉnh) tương tác với nhau (được gọi là các cạnh). Học máy đồ thị là một nhánh của Học máy nhằm tìm hiểu ý nghĩa của dữ liệu quan hệ này được mã hóa trong cấu trúc đồ thị, hướng tới các ứng dụng như mô hình hóa và dự đoán hành vi trên đồ thị (ví dụ: Một người sẽ làm gì trong tương lai? Họ sẽ tương tác với những người hoặc đối tượng nào khác với?)
Nghiên cứu
Là một nhà nghiên cứu giỏi, Neil có một danh sách dài các công trình và ấn phẩm được ghi nhận. Ví dụ: tại Twitch, nền tảng phát trực tiếp, phổ biến cho phép những người đam mê trò chơi tìm thấy những người sáng tạo nội dung và trò chơi, anh ấy đã giúp giải quyết một vấn đề lớn về “viewbot”. Những người phát trực tuyến đã trả tiền cho các nhà cung cấp mạng botnet để tăng số liệu về lượng người xem. Tác phẩm của Neil đã được xuất bản tại TheWebConf2017.
Tại Microsoft, Neil và nhóm của anh ấy đã xây dựng Đồ thị học thuật của Microsoft, đo lường tác động của nghiên cứu khoa học theo những cách vượt xa các chỉ số dựa trên số lượng đơn giản như số lượng trích dẫn, chỉ số h và các yếu tố tác động của tạp chí, anh ấy nói. Trong lần thực tập đầu tiên của mình, tại Phòng thí nghiệm Quốc gia Lawrence Livermore, anh ấy đã làm việc để tự động xác định và tóm tắt các mẫu hành vi trong bộ dữ liệu biểu đồ tiến hóa theo thời gian. Anh ấy cũng đã làm việc để xác định Thông tin sai lệch từ Ảnh chụp màn hình trang web trong dữ liệu Twitter.
Học bổng
Neil đã tránh được những thách thức lớn về tài chính vì có khá nhiều học bổng. Anh ấy đã có thể bù đắp một phần đáng kể chi phí học tập của mình bằng cách theo đuổi nghiên cứu đại học tại Đại học Bang NC, lấy bằng Cử nhân Khoa học Máy tính mà không mắc nợ.
Neil nói rằng anh ấy đã may mắn nhận được bằng Tiến sĩ “miễn phí”, do chương trình CS của Đại học Carnegie Mellon vận hành như thế nào. Anh ấy nói: “Nghiên cứu và trợ cấp của tôi ở đây cũng được hỗ trợ bởi Học bổng nghiên cứu sau đại học của NSF, cho phép tôi duy trì mức sống hợp lý khi tôi học tập.
Các kế hoạch trong tương lai
“Tôi muốn tiếp tục nghiên cứu trong ngành. Tôi thích không ngừng học hỏi và từng bước cải thiện bản thân,” Neil nói. Giúp người khác hiểu cách suy nghĩ về tác động của các vấn đề, cách chia nhỏ chúng thành các bước có thể đạt được và kiên trì cho đến khi họ có thể đóng góp cho đổi mới khoa học và chứng kiến sự phát triển và thành công lâu dài của họ là điều vô cùng bổ ích đối với Neil.
Trong thời gian rảnh…
Neil, người gần đây đang đọc khá nhiều sách của Stephen King, cho biết: “Tôi thích đọc sách, nâng tạ và chơi trò chơi điện tử. Anh ấy đã nâng tạ trong nhiều năm nay. “Tôi đã từng thi đấu môn cử tạ khi còn học cao học,” Neil nói, người coi đây là hoạt động trị liệu và đơn độc sau một ngày dài suy nghĩ. Anh ấy cũng có thể dành hàng giờ để chơi Starcraft 2 và Dota 2, hai trong số những môn thể thao điện tử lớn nhất.
- Theo dõi Neil Shah trên LinkedIn