Masooma Ali,加拿大密西沙加的开发者
Masooma is available for hire
Hire Masooma

Masooma Ali

Verified Expert  in Engineering

Mathematical Modeling Developer

Location
Mississauga, Canada
Toptal Member Since
August 18, 2022

Masooma有超过9年的经验,将数据科学应用于天文学和理论物理等领域的问题. 她还从事自动化软技能培训和育儿培训. 她使用结构化和非结构化数据建立了ML模型,目前喜欢将ML应用于自然语言处理(NLP)和音频任务. Masooma还拥有丰富的协作开发软件的经验,并在工业界和学术界交付了项目.

Portfolio

Sesh
PyTorch, TensorFlow, Scikit-learn, Pandas, SQL, Kaldi, Librosa, Python...
GuruOps
Python 3, Amazon Web Services (AWS), Transformers, Scikit-learn, Node.js, Docker
Stepscan
Python 3, Data Visualization

Experience

Availability

Part-time

Preferred Environment

Unix, Visual Studio Code (VS Code), Jupyter Notebook, Python 3

The most amazing...

...我做的是一个主动的说话人识别系统,它使用音频和视频数据在视频中当前说话人周围放置一个边界框.

Work Experience

Senior Data Scientist

2021 - PRESENT
Sesh
  • 将产品功能想法转化为可解决的机器学习问题,以解决公司应用程序中的七个关键功能.
  • 研究、原型化和部署情感识别模型. 确定讲话的清晰度和可理解性, speaker recognition, jargon identification, NLP semantic similarity tasks, active speaker recognition, and content recommendation.
  • 使用AWS基础设施构建低延迟微服务. 支持在线预测,延迟低于100毫秒.
  • 构建内部工具表面模型预测人类测试和人类, in-the-loop training. 为各种培训任务定制工具.
技术:PyTorch, TensorFlow, Scikit-learn, Pandas, SQL, Kaldi, Librosa, Python, JavaScript, Go

Data Scientist

2020 - 2020
GuruOps
  • 建立了一个模型,将博客文章转换为Twitter线程.
  • 将模型作为微服务部署在Amazon SageMaker上.
  • 设置数据模型和关系数据库来管理用户请求.
  • 管理一名初级工程师,在React和Node中开发应用程序的后端和前端.js.
技术:Python 3, Amazon Web Services (AWS), Transformers, Scikit-learn, Node.js, Docker

Applied Scientist

2018 - 2018
Stepscan
  • 开发了一种新的基于图形的算法,用于确定人们在装有压力传感器的瓷砖上行走的轨迹和姿势.
  • 为实验室测试提供了一个功能齐全且可调的原型.
  • 提供调优和扩展模型的技术文档.
技术:Python 3,数据可视化

Brand Alignment Analyzer

设计并部署了一种算法,以确定投资者推介和公司营销材料之间的语义和词汇一致性. 该算法将传统的机器学习技术与深度学习嵌入模型相结合,以产生与营销材料(例如,广告)一致的宣传时间量的见解.e., on-topic time). 我在显示的与营销材料一致的文字记录上突出了句子.

Active Speaker Recognition

开发了一个多模态深度学习模型来识别视频中的主动说话者. 模型的输入是通过每秒叠加10个视频帧并提供检测到的物体的轨迹来准备的. 我创建的模型将这些图像与音频结合起来,如果在屏幕上检测到扬声器,就可以预测当前扬声器周围的边界框.

Topic Modeling on Forum Posts

seh希望将其技术应用于育儿领域,并需要为父母确定一系列紧迫的核心问题. 我从北美的育儿论坛上搜集了50多万篇帖子. 我用NLP技术对这些问题进行了分析,列出了父母讨论的话题,并定义了子类来识别养育问题. To model the topics, 我使用词嵌入和聚类技术(UMAP)结合词汇链进行子分类. 这个项目有一个大数据可视化组件,因为我必须以一种易于使用的格式向产品团队展示我的发现. 这项工作直接影响了Sesh为父母提供的产品路线图.
2014 - 2019

PhD Degree in Physics

新不伦瑞克大学-弗雷德里克顿,加拿大

2009 - 2011

Master's Degree in Astrophysics

University of Bonn - Bonn, Germany

2006 - 2009

Bachelor's Degree in Physics

德里大学-新德里,印度

Libraries/APIs

PyTorch, TensorFlow, Scikit-learn, Pandas, Node.. js,自然语言工具包(NLTK), SpaCy, OpenCV, FFmpeg

Tools

MATLAB, Kaldi, Whisper

Paradigms

数据科学,高性能计算

Languages

Python 3, Python 2, Python, SQL, Perl, Fortran, c++, JavaScript, Go

Platforms

Jupyter Notebook, Unix, Amazon Web Services (AWS), Docker, Visual Studio Code (VS Code)

Other

马尔科夫链蒙特卡罗(MCMC)算法, Librosa, Data Analysis, Mathematical Modeling, Numerical Simulations, Machine Learning, Numerical Methods, Transformers, Data Visualization, Software Development, Data Modeling, Natural Language Processing (NLP), Data Mining, Web Scraping, GPT, 生成预训练变压器(GPT)

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

Start your risk-free talent trial

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring