(Décembre 12, 2022) Au cours de ses années de lycée à la Northwest Guilford High School, Neil Shah a commencé à chercher des opportunités pour s'impliquer dans la recherche en informatique. Il a envoyé un e-mail à de nombreux professeurs à la recherche d'une opportunité de les aider dans leurs recherches, même gratuitement.
Neil avait de l'expérience et des compétences en programmation, et un désir d'apprendre, mais pas de diplôme ou de formation avancée. Finalement, un professeur de la NC State University, le professeur Nagiza Samatova, a répondu à son e-mail, et il a fini par passer un été à aider ses étudiants diplômés dans leurs projets de recherche.
« Cette expérience m'a aidé à découvrir que j'avais une véritable passion pour approfondir les problèmes. J'ai aimé creuser mon cerveau sur un problème pendant longtemps et ce névrosisme m'a bien servi, alors et maintenant », sourit Neil Shah, qui est maintenant chercheur principal chez Snap Inc., Seattle, dont le travail couvre largement l'exploration de données, l'apprentissage automatique. , sciences des réseaux et sciences sociales computationnelles. Au fil des ans, ses recherches approfondies ont abouti à plus de 45 publications dans des revues en plus des prix du meilleur article.
La vie d'immigré
NeilLes parents de ont déménagé de Mumbai aux États-Unis lorsqu'ils avaient environ 30 ans, et il avait un an et demi. Son père travaille comme directeur, Global Customs Compliance dans une entreprise textile, tandis que sa mère est ingénieure en assurance qualité des logiciels dans une entreprise de fabrication de distributeurs de carburant.
« Mes parents sont des immigrants de première génération et ils ont travaillé dur pour me construire une vie dans ce pays. Ils m'ont inculqué de grandes valeurs, en particulier une solide éthique de travail, l'intégrité et la persévérance », partage-t-il avec Indien du monde. Pendant les premières années, la famille Shah a vécu à Raleigh, Caroline du Nord, États-Unis, puis a déménagé à Greensboro, où Neil a finalement obtenu son diplôme d'études secondaires. À la maison, il aimait jouer à des jeux vidéo, naviguer sur Internet et trouver des tutoriels pour apprendre à programmer des logiciels, etc. Au collège, son école demandait aux élèves d'acheter des calculatrices graphiques TI-83+ pour les aider à apprendre certains concepts d'algèbre/géométrie.
Premiers pas en tant que codeur
L'une de ses premières expériences sérieuses dans la programmation a été d'utiliser le langage de programmation simple de ces calculatrices pour écrire des logiciels mathématiques et scientifiques de base. "J'avais aussi l'habitude d'écrire des jeux simples de style" choisissez votre propre aventure "(CYOA) sur la TI-83 +", explique le joueur de 30 ans, qui aimait créer de nouveaux outils.
Fait intéressant, sa collaboration avec le professeur Nagiza, avec qui il s'est associé pendant ses années de lycée, a persisté pendant des années par la suite. Il a également travaillé avec la fille de Nagiza, Katie, (également au lycée) sur un important concours de recherche pour les élèves du secondaire.
"Nagiza et son collègue, le professeur Anatoli Melechko, nous ont encadrés dans le cadre d'un projet visant à identifier les instabilités dans le plasma dans les données de réacteurs à fusion nucléaire simulées par ordinateur, qui nous ont permis de gagner 50 25 $ en équipe (XNUMX XNUMX $ chacun entre moi et Katie) et d'aider nous payons pour les études de premier cycle », sourit Neil, qui a ensuite rejoint NC State pour les études de premier cycle après avoir terminé ses études secondaires.
L'exploration de données
Pendant qu'il effectuait des recherches à la NC State University, Neil a également travaillé sur la gestion et la compression des données, à savoir comment gérer le stockage et l'indexation de très grands ensembles de données.
Un aspect particulièrement fascinant de l'exploration de données et de l'apprentissage automatique est qu'une grande quantité de données générées aujourd'hui sont de nature sociale, c'est-à-dire qu'elles reflètent le comportement et les actions humaines. Par exemple, comment les humains interagissent les uns avec les autres, ou comment ils choisissent de passer leur temps à regarder des vidéos en ligne ou à interagir avec du contenu.
"Ces types d'interactions créent des données extrêmement précieuses qui encapsulent fondamentalement des informations sur la façon dont les humains se comportent. Ces données peuvent être utilisées comme une lentille pour comprendre les gens, ce qui est au centre de la discipline des sciences sociales computationnelles. Il dit que comprendre que le comportement humain est prévisible et ordonné a été quelque chose d'extrêmement instructif pour lui. Neil a obtenu un baccalauréat en informatique et une mineure en mathématiques en 2013.
Doctorat de la CMU
Neil a passé un peu plus de quatre ans à l'Université Carnegie Mellon, où il a poursuivi son doctorat (de 2013 à 2017), immédiatement après avoir obtenu son diplôme de la NC State University.
"Mon travail à CMU était axé sur la compréhension et la modélisation de données graphiques à grande échelle, en particulier dans le contexte de l'identification de comportements anormaux, suspects ou abusifs dans les réseaux sociaux et les plateformes en ligne", explique Neil.
Étant donné que la perception en ligne est si essentielle à nos impressions sur les marques, les influenceurs et les marchands en ligne, il existe d'énormes incitations financières et sociales pour manipuler cette perception, par exemple, en achetant de faux abonnés sur les plateformes sociales, de fausses critiques sur la notation et le commerce électronique. plates-formes, explique le chercheur.
NeilLa thèse de s'est concentrée sur des méthodes pour découvrir automatiquement ces comportements néfastes dans des ensembles de données de graphes à grande échelle en identifiant des modèles d'interaction anormaux dans ces graphes qui sont laissés comme traces de ces comportements. Ceux-ci ont été utilisés dans les systèmes déployés chez Google, Flipkart et Twitch, et plus encore.
Après avoir soutenu son doctorat en octobre 2017, Neil a travaillé avec le célèbre expert du cyberespace, le professeur Srijan Kumar, pour rédiger un article d'enquête intitulé "Faux renseignements sur le Web et les médias sociaux". Il a fourni un aperçu d'une grande variété de travaux universitaires pertinents sur ces sujets. Cet ouvrage a été cité plus de 370 fois au cours des dernières années.
Au travail
Il a rejoint Snap très peu de temps après avoir terminé son doctorat, vers la fin de 2017. Il dirige des initiatives en ML graphique et gère une équipe de scientifiques, d'ingénieurs et de stagiaires de recherche pour le développement de méthodes de pointe en ML graphique.
Mon équipe travaille à la fois sur l'activation des applications internes des méthodes de graph ML aux problèmes commerciaux (modèles de recommandation et de classement), ainsi que sur la recherche percutante visible de l'extérieur, accessible (par exemple lors de conférences de haut niveau) et open-source.
Ses travaux portent principalement sur les techniques d'apprentissage automatique sur les données de graphes, vers des applications de modélisation du comportement des utilisateurs sur les données des réseaux sociaux. Cela comprend l'amélioration de l'expérience utilisateur en détectant les faux utilisateurs, les actions frauduleuses et le spam, ainsi que l'amélioration des systèmes de classement et de recommandation.
Graphique ML
Les « graphes » sont une structure de données fondamentale en informatique qui représente des objets (appelés nœuds ou sommets) interagissant les uns avec les autres (appelés arêtes). Graph ML est une branche du Machine Learning qui cherche à donner un sens à ces données relationnelles encodées dans une structure de graphe, vers des applications comme la modélisation et la prédiction de comportements sur des graphes (par exemple, que fera une personne dans le futur ? Avec quelles autres personnes ou objets vont-ils interagir avec?)
Une recherche
Chercheur prolifique, Neil a une longue liste de travaux et de publications à son actif. Chez Twitch, par exemple, la plate-forme populaire de diffusion en direct qui permet aux passionnés de jeux de trouver des créateurs de jeux et de contenu, il a aidé à résoudre un problème majeur de "viewbotting". Les streamers payaient des fournisseurs de botnets pour gonfler les statistiques d'audience. Le travail de Neil a été publié à TheWebConf2017.
Chez Microsoft, Neil et son équipe ont construit le Microsoft Academic Graph, qui mesure l'impact de la recherche scientifique d'une manière qui va au-delà de simples mesures basées sur le nombre comme le nombre de citations, l'index h et les facteurs d'impact des revues, dit-il. Lors de son premier stage, au Lawrence Livermore National Laboratory, il a travaillé pour identifier et résumer automatiquement les modèles de comportement dans des ensembles de données graphiques évoluant dans le temps. Il a également travaillé sur l'identification de la désinformation à partir de captures d'écran de sites Web dans les données Twitter.
Bourses d'études
Neil a été épargné par de gros problèmes financiers grâce à plusieurs bourses d'études. Il a pu compenser une part importante de ses frais de scolarité en poursuivant des recherches de premier cycle à la NC State University, obtenant son BS en informatique sans aucune dette.
Neil dit qu'il a eu de la chance d'obtenir son doctorat "gratuitement", étant donné le fonctionnement du programme CS de l'Université Carnegie Mellon. "Mes recherches et mon allocation ici ont également été financées par la bourse de recherche pour diplômés de la NSF, ce qui m'a permis de maintenir un niveau de vie raisonnable pendant mes études", dit-il.
Les plans futurs
« J'aimerais continuer à faire de la recherche dans l'industrie. J'aime constamment apprendre et m'améliorer progressivement », déclare Neil. Aider les autres à comprendre comment réfléchir à l'impact des problèmes, comment les décomposer en étapes réalisables et persister jusqu'à ce qu'ils soient capables de contribuer à l'innovation scientifique et de voir leur succès et leur croissance à long terme est extrêmement gratifiant pour Neil.
En loisir…
"J'aime lire, soulever des poids et jouer à des jeux vidéo", déclare Neil, qui lit récemment plusieurs livres de Stephen King. Il soulève des poids depuis de nombreuses années maintenant. "J'avais l'habitude de faire de la compétition de dynamophilie quand j'étais à l'université", explique Neil, qui trouve cette activité thérapeutique et solitaire après une longue journée de réflexion. Il peut également passer des heures à jouer à Starcraft 2 et Dota 2, deux des plus grands e-sports.
- Suivez Neil Shah sur LinkedIn