(Dezember 12, 2022) Während seiner Highschool-Jahre an der Northwest Guilford High School begann Neil Shah, nach Möglichkeiten zu suchen, sich in der Informatikforschung zu engagieren. Er schickte E-Mails an viele Professoren, die nach einer Möglichkeit suchten, ihnen bei ihrer Forschung zu helfen, sogar kostenlos.
Neil hatte Programmiererfahrung und -kenntnisse und Lust zu lernen, aber keinen Abschluss oder Weiterbildung. Schließlich antwortete eine Professorin der NC State University, Prof. Nagiza Samatova, auf seine E-Mail, und er verbrachte schließlich einen Sommer damit, ihren Doktoranden bei ihren Forschungsprojekten zu helfen.
„Diese Erfahrung half mir zu entdecken, dass ich eine echte Leidenschaft dafür hatte, mich tief in Probleme einzuarbeiten. Ich habe es genossen, mir lange Zeit den Kopf über ein Problem zu zerbrechen, und dieser Neurotizismus hat mir damals wie heute gute Dienste geleistet“, lächelt Neil Shah, der jetzt leitender Forschungswissenschaftler bei Snap Inc. in Seattle ist und dessen Arbeit sich weit über Data Mining und maschinelles Lernen erstreckt , Netzwerkwissenschaft und Computational Social Science Domänen. Im Laufe der Jahre hat seine umfangreiche Forschung zu über 45 Zeitschriftenveröffentlichungen und Auszeichnungen für die besten Arbeiten geführt.
Das Immigrantenleben
NeilSeine Eltern zogen von Mumbai in die USA, als sie ungefähr 30 Jahre alt waren, und er war eineinhalb Jahre alt. Sein Vater arbeitet als Director, Global Customs Compliance bei einem Textilunternehmen, während seine Mutter als Staff Software Quality Assurance Engineer bei einem Hersteller von Zapfsäulen arbeitet.
„Meine Eltern sind Einwanderer der ersten Generation und haben hart gearbeitet, um mir in diesem Land ein Leben aufzubauen. Sie haben mir großartige Werte vermittelt, insbesondere eine starke Arbeitsmoral, Integrität und Beharrlichkeit“, teilt er mit Globaler Inder. In den ersten Jahren die Familie Shah lebte in Raleigh, NC, USA und zog später dorthin Greensboro, wo Neil schließlich die High School abschloss. Zu Hause spielte er gerne Videospiele, surfte im Internet und fand Tutorials, um zu lernen, wie man Software programmiert usw. In der Mittelstufe verlangte seine Schule von den Schülern den Kauf von TI-83+ Grafikrechnern, um ihnen beim Erlernen einiger Konzepte in Algebra/Geometrie zu helfen.
Erste Schritte als Programmierer
Eine seiner ersten ernsthaften Erfahrungen mit dem Programmieren war die Verwendung der einfachen Programmiersprache dieser Taschenrechner, um grundlegende mathematische und naturwissenschaftliche Software zu schreiben. „Früher habe ich auf dem TI-83+ auch einfache Spiele im Stil von „Choose your own adventure“ (CYOA) geschrieben“, sagt der 30-Jährige, der gerne neue Tools entwickelte.
Interessanterweise hielt seine Zusammenarbeit mit Prof. Nagiza, mit dem er in seiner Highschool-Zeit in Kontakt kam, noch Jahre danach an. Er arbeitete auch mit Nagizas Tochter Katie (ebenfalls in der Highschool) an einem großen Forschungswettbewerb für Highschool-Schüler.
„Nagiza und ihr Kollege Prof. Anatoli Melechko haben uns bei einem Projekt zur Identifizierung von Instabilitäten im Plasma in computersimulierten Kernfusionsreaktordaten betreut, das damit endete, dass wir als Team 50 US-Dollar gewannen (jeweils 25 US-Dollar zwischen mir und Katie) und halfen wir zahlen für die Grundschule“, lächelt Neil, der nach dem Abitur zum Grundstudium in die NC State ging.
Data Mining
Als er an der NC State University forschte, befasste sich Neil auch mit Datenmanagement und -komprimierung – nämlich mit der Handhabung der Speicherung und Indizierung sehr großer Datensätze.
Ein besonders faszinierender Aspekt von Data Mining und maschinellem Lernen ist, dass eine große Menge an Daten, die heute generiert werden, sozialer Natur sind, was bedeutet, dass sie menschliches Verhalten und Handeln widerspiegeln. Zum Beispiel, wie Menschen miteinander interagieren oder wie sie ihre Zeit damit verbringen, Online-Videos anzusehen oder sich mit Inhalten zu beschäftigen.
„Diese Arten von Interaktionen erzeugen immens wertvolle Daten, die grundlegend Informationen darüber enthalten, wie sich Menschen verhalten. Diese Daten können als Linse zum Verständnis von Menschen verwendet werden, was ein zentraler Schwerpunkt der Disziplin Computational Social Science ist.“ Er sagt, zu verstehen, dass menschliches Verhalten Vorhersagbarkeit und Ordnung hat, war für ihn etwas äußerst Erhellendes. Neil schloss sein Studium 2013 mit einem BS in Informatik und einem Nebenfach in Mathematik ab.
Promotion an der CMU
Neil verbrachte etwas mehr als vier Jahre an der Carnegie Mellon University, wo er direkt nach seinem Abschluss an der NC State University promovierte (von 2013 – 2017).
„Meine Arbeit an der CMU konzentrierte sich auf das Verständnis und die Modellierung umfangreicher Graphdaten, insbesondere im Zusammenhang mit der Identifizierung anomaler, verdächtiger oder missbräuchlicher Verhaltensweisen in sozialen Netzwerken und Online-Plattformen“, erklärt Neil.
Angesichts der Tatsache, dass die Online-Wahrnehmung so entscheidend für unsere Eindrücke von Online-Marken, Influencern und Händlern ist, gibt es enorme finanzielle und soziale Anreize, diese Wahrnehmung zu manipulieren, beispielsweise durch den Kauf gefälschter Follower auf sozialen Plattformen, gefälschter Bewertungsbewertungen und E-Commerce Plattformen, sagt der Forscher.
NeilDie Dissertation konzentrierte sich auf Methoden zur automatischen Entdeckung solch schändlicher Verhaltensweisen in großen Graphdatensätzen, indem anomale Interaktionsmuster in diesen Graphen identifiziert werden, die als Spuren dieses Verhaltens zurückbleiben. Diese wurden in eingesetzten Systemen bei Google, Flipkart und verwendet Twitch und mehr.
Nach der Verteidigung seiner Promotion im Oktober 2017 arbeitete Neil mit dem renommierten Cyberspace-Experten Prof. Srijan Kumar zusammen, um ein Übersichtspapier mit dem Titel „False Information on the Web and Social Media“ zu schreiben. Es bot einen Überblick über eine Vielzahl relevanter wissenschaftlicher Arbeiten zu diesen Themen. Diese Arbeit wurde in den letzten Jahren über 370 Mal zitiert.
Auf Arbeit
Er kam sehr kurz nach Abschluss seiner Promotion gegen Ende 2017 zu Snap. Er leitet Initiativen im Bereich Graph-ML und leitet ein Team von Wissenschaftlern, Ingenieuren und Forschungspraktikanten zur Entwicklung modernster Graph-ML-Methoden.
Mein Team arbeitet sowohl an der Ermöglichung interner Anwendungen von Graph-ML-Methoden für Geschäftsprobleme (Empfehlungs- und Ranking-Modelle) als auch an wirkungsvoller Forschung, die extern sichtbar, zugänglich (z. B. auf Top-Konferenzen) und Open Source ist.
Seine Arbeit konzentriert sich hauptsächlich auf Techniken des maschinellen Lernens auf Graphdaten und auf Anwendungen zur Modellierung des Benutzerverhaltens auf Daten sozialer Netzwerke. Dazu gehört die Verbesserung der Benutzererfahrung durch Erkennung gefälschter Benutzer, betrügerischer Aktionen und Spam sowie die Verbesserung von Ranking- und Empfehlungssystemen.
Diagramm ML
„Graphen“ sind eine grundlegende Datenstruktur in der Informatik, die Objekte (Knoten oder Vertices genannt) darstellen, die miteinander interagieren (Kanten genannt). Graph ML ist ein Zweig des maschinellen Lernens, der versucht, diese relationalen Daten, die in der Graphstruktur codiert sind, für Anwendungen wie die Modellierung und Vorhersage von Verhaltensweisen in Graphen zu verstehen (z. B. Was wird eine Person in der Zukunft tun? Mit welchen anderen Personen oder Objekten wird sie interagieren). mit?)
Forschung
Neil ist ein produktiver Forscher und kann auf eine lange Liste von Arbeiten und Veröffentlichungen zurückblicken. Bei Twitch zum Beispiel, der beliebten Livestreaming-Plattform, die es Gaming-Enthusiasten ermöglicht, Gaming- und Content-Ersteller zu finden, half er bei der Lösung eines großen „Viewbotting“-Problems. Streamer bezahlten Botnet-Anbieter, um die Zuschauerzahlen zu erhöhen. Neils Arbeit wurde auf der TheWebConf2017 veröffentlicht.
Bei Microsoft haben Neil und sein Team den Microsoft Academic Graph entwickelt, der die Wirkung wissenschaftlicher Forschung auf eine Weise misst, die über einfache zählbasierte Metriken wie Zitationszahl, H-Index und Impact-Faktoren für Zeitschriften hinausgeht, sagt er. Bei seinem ersten Praktikum am Lawrence Livermore National Laboratory arbeitete er daran, Verhaltensmuster in zeitabhängigen Graphdatensätzen automatisch zu identifizieren und zusammenzufassen. Er hat auch daran gearbeitet, Fehlinformationen von Website-Screenshots in Twitter-Daten zu identifizieren.
Stipendien
Neil durch etliche Stipendien vor großen finanziellen Herausforderungen bewahrt. Er konnte einen beträchtlichen Teil seiner Schulkosten ausgleichen, indem er an der NC State University forschte und seinen BS in Informatik ohne Schulden machte.
Neil sagt, er habe das Glück gehabt, seinen Doktortitel „kostenlos“ zu bekommen, wenn man bedenkt, wie das CS-Programm der Carnegie Mellon University funktioniert. „Meine Forschung und mein Stipendium hier wurden auch durch das NSF Graduate Research Fellowship unterstützt, das es mir ermöglichte, während meines Studiums einen angemessenen Lebensstandard aufrechtzuerhalten“, sagt er.
Zukunftspläne
„Ich möchte weiter in der Industrie forschen. Ich liebe es, ständig dazuzulernen und mich schrittweise zu verbessern“, sagt Neil. Anderen dabei zu helfen, zu verstehen, wie man über die Auswirkungen von Problemen nachdenkt, wie man sie in erreichbare Schritte zerlegt und so lange durchhält, bis sie in der Lage sind, zur wissenschaftlichen Innovation beizutragen und ihren langfristigen Erfolg und ihr Wachstum zu sehen, ist für Neil immens lohnend.
In der Freizeit …
„Ich lese gerne, hebe Gewichte und spiele Videospiele“, sagt Neil, der in letzter Zeit einige Bücher von Stephen King liest. Er trainiert seit vielen Jahren mit Gewichten. „Als ich in der Graduiertenschule war, habe ich früher im Powerlifting an Wettkämpfen teilgenommen“, sagt Neil, der es nach einem langen Tag des Nachdenkens als therapeutische und einsame Aktivität empfindet. Er kann auch Stunden damit verbringen, Starcraft 2 und Dota 2 zu spielen, zwei der größten E-Sportarten.
- Folgen Sie Neil Shah weiter LinkedIn