Denis Volk
验证专家 in 工程
数据科学开发人员
Denis是一名高级全栈人工智能工程师和数据科学家, 精通现代生成技术(GPT-4), Midjourney, and more), 机器学习, ETL管道, 数据分析, 数学建模, big data, and MLOps. 他有数学博士学位, 他的数据科学专长包括概率风险建模, 收入预测, 地理空间数据分析, 手写识别, 时间序列中的异常检测, 工程数据, 以及团队领导.
Portfolio
Experience
Availability
首选的环境
Jupyter, Bash, Git, Python, MacOS, Visual Studio Code (VS Code), 亚马逊网络服务(AWS)
最神奇的...
...我构建的系统是一个端到端的云ML解决方案,用于高精度的房屋租金价格预测和风险估计.
工作经验
创始人,首席技术官
OkGPT
- 创造了OkGPT,一个人工智能个人助理信使机器人. 它允许用户通过语音和文本与最先进的人工智能进行交互,同时提供额外的生产力功能和集成.
- 优化代码以并行处理用户查询,从而大幅提高bot性能.
- 实现了一个具有多层的复杂订阅系统, 推荐链接, discounts, 付款方式.
- 建立持续集成/部署程序.
- 在文本和语音消息中实现了对大多数语言的支持.
- 集成了多个api,包括Telegram, OpenAI, Google, Redis, Amplitude, Datadog等.
- 管理三个团队成员和一些外部合作者.
人工智能工程师
生成式科技创业公司(ChatGPT)
- 开发了一个应用程序的MVP,以自然语言查询企业数据. 给定访问数据库的权限和一个关于数据的自然语言问题, 应用程序会将答案输出为一个图或一个小表格.
- 设计并微调提示,以提高SQL代码生成的质量和正确性.
- 为数据库列和最终表创建了一个自动注释器.
高级机器学习工程师
区块链安全公司
- 创建了一个机器学习模型,在恶意智能合约造成伤害之前自动检测它们.
- 为模型输出构建可视化工具,以审核其决策.
- 将模型作为Lambda无服务器功能部署到AWS云平台.
高级Python工程师
Turn LLC
- 开发了一款应用程序,可以将英语文本翻译成一种特殊的伪音标.
- 作为顾问,帮助定义可交付成果,然后是翻译工具的整体架构.
- 帮助定义文本注释需求并监督注释过程.
自由职业高级数据科学家和数据工程师
总部位于以色列的人力资源技术创业公司
- 创建了一个BI仪表板来查询和汇总大量的半结构化数据.
- 在AWS云上设置和调优Elasticsearch集群和Kibana.
- 开发一个ETL管道,将1tb的原始数据摄取到Elasticsearch中.
- 架构和指导核心相似性引擎的创建,为候选人评分.
- 在砖和Spark中创建了一个大数据管道,以丰富输入数据并为ML准备功能.
- 使用预训练的NLP深度神经网络创建语义文本嵌入, 显著提高了相似度引擎输出结果.
- 使用Spark GraphX开发了一个分数来衡量公司在就业市场上的吸引力.
- 准备定制深度学习模型来构建更丰富的嵌入, 包括各种数据源和元数据.
- 领导与外部数据提供商的通信,并创建与他们的api接口的基础设施.
- 推动最佳DevOps和MLOps实践的实现,以提高ETL的可靠性和可重复性, 功能一代, 模型的训练, 推理子系统.
自由职业高级数据科学家和数据工程师
美国运营/科技创业公司(通过Toptal)
- 建立了一个基础的端到端机器学习解决方案,可以预测房地产的公平价格, 因此,消除了人工评估的需要,并使公司能够通过向客户提供快速响应来运行业务.
- 设计并实现了一个自动刷新ETL管道注入, cleans, joins, 并每天从AWS S3存储中丰富新数据.
- 用Scikit-learn开发了一个可解释的机器学习模型, CatBoost, Lifelines, FBProphet, FAISS, 以及由多个子模型组成并满足业务单调性约束的SHAP.
- 根据新收集的数据,建立一个持续的机器学习程序,用于每天的模型再训练和重新部署.
- 设计并实现了一个自动模型提升机制,以确保通过日常再培训过程生成的模型只有在具有足够好的性能指标并满足业务约束的情况下才能部署到生产中.
- 创建历史数据模拟系统,在公司启动之前生成合成数据,并启用回测功能.
- 在AWS云中架构和构建所需的基础设施:EC2实例和vpc, 开发的Docker环境, testing, 和生产, 用于ETL和ML的气流管道, MLFlow模型存储.
- 为数据探索和数据质量管理创建了各种仪表板, 模型性能监控, 以及可视化预测.
- 监督其他数据科学团队成员并与工程团队协调.
数据科学传播者
Skillbox
- 回顾并改进了数学、数据科学和机器学习的核心课程.
- 监督新课程的创建, 包括视频讲座和练习, 关于数据科学, Analytics, SQL, Power BI, 和表.
- 招聘、面试和筛选新课程的讲师和导师.
Lecturer
Netology
- 为数据科学家准备并讲授微积分课程.
- 为数据科学家开发并讲授线性代数课程.
- 为数据科学家设计、准备并讲授概率论课程.
高级数据科学家
KPMG
- 创建了一个机器学习模型,可以根据商店位置预测零售连锁店的收入, 本地人口统计资料, GIS功能, 季节性, 还有其他因素.
- 开发并部署了一个可解释的机器学习模型,该模型对B2B客户的支付违约风险进行评分,并为评分提供解释. 该模型大大减少了每周风险评估的工作量.
- 建立概率贝叶斯机器学习模型,预测哪些在建公寓楼无法及时投入使用. 该模型帮助对冲风险所需的资金减少了两倍.
- 开发和部署NLP模型,根据合同类型自动标记大量住房合同,并提取承包商方名称, 地址的实体, 以及其他属性.
- 构建并部署了一个模型来预测某化工厂蒸发器堵塞问题. 这使得该单位在发生故障之前能够及时进行先发制人的服务, 节省了数百万美元的生产时间.
- 在上述项目中领导并指导了一个由初级和中级数据科学家组成的团队.
- 与客户沟通, 确保将业务目标正确地转化为数据科学和机器学习任务——向客户解释见解和模型.
- 架构化的ETL管道, 包括数据采集, 数据摄取, 合并内部和外部数据集, 数据清理和验证, 数据转换, 并在几个不同的项目中进行特征工程.
- 在几个不同的项目上设计模型性能度量和它们的度量协议.
- 为零售银行开发ML系统,根据客户过去的交易模式向客户推荐银行产品. 这包括构建ETL管道和ML推荐系统.
中国科学院高级研究中心招收博士后研究员
国立研究型大学-高等经济学院
- 发明了一种新的数学方法用于人脑的交叉频率同步分析.
- 将该方法作为MATLAB工具箱实现,并运行测试,确认结果与先前已知的科学数据一致.
- 准备并在顶级期刊上发表方法和研究结果.
- 指导多名学生的硕士学位项目.
- 讲授计算神经科学的硕士课程.
ERC高级资助博士后研究员
罗马大学(Tor Vergata)
- 发现了一种新的几何现象,解释了与晶体热传导有关的某些数学模型的刚性.
- 发现了与马尔可夫场模型相关的多维分段等距映射吸引子的一个新的稳定性性质.
- 发现几乎所有三区间的区间平移映射都是有限型的.
- 准备论文,描述研究结果,并在高级期刊上发表.
访问科学家(数学及三维扫描顾问)
发育障碍基础研究所
- 建立并验证了妊娠期人胎盘血管生长的数学模型.
- 制定了3D数据采集协议, 包括样品的三维表面扫描和微ct扫描.
- 创建一个ETL管道来清理和预处理收集的样本.
- 分析收集的数据,拟合数学模型,并解释研究结果.
Göran Gustafsson博士后研究员
皇家理工学院
- 建立了圆映射半群的旋转数定义了圆映射半群的产生子.
- 发现了与马尔可夫场模型相关的分段等距映射吸引子的分形结构.
- 准备描述研究结果的论文,并在主要期刊上发表.
- 讲授动力系统结构稳定性的博士课程.
博士后研究人员
SISSA
- 发现了一类新的动力系统它们具有持久的大质量吸引子.
- 建立了马尔可夫链上的斜积动力系统与非线性随机漫步之间的深层关系.
- 准备描述研究结果的论文,并在主要期刊上发表.
研究员及软件工程师
Artec集团
- 设计并实现了生物识别机器学习人脸识别算法.
- 创建和实施新的识别算法的统计测试程序.
- 开发了3D激光和闪光扫描仪的校准程序.
- 重构Windows32代码,使其跨平台.
- 实现和调整3D表面重建算法.
- 条形码编码和扫描应用软件.
- 管理构建服务器,并负责团队的CI/CD流程.
研究员及软件工程师
A4Vision
- 设计并实现了二维图像上的人脸检测算法, 面部特征检测, 并在3D表面上对齐.
- 实现和调整3D表面重建算法.
- 为人脸识别的新机器学习算法建立并实现了统计测试程序.
- 构建并实现了一个基于日志解析的测试报告自动生成系统.
- 实现和管理专用于构建服务器的自动构建系统.
- 校准光学相机和激光的3D扫描仪.
- 将算法核心迁移到嵌入式平台.
Intern
Parascript
- 为手写文本识别的新型机器学习方法开发了数学背景.
- 作为c++库实现了手写文本识别的新方法.
- 在科学会议和研讨会上展示我的研究.
Experience
房屋租赁价格预测
零售连锁商店的收入预测
支付违约风险评分
建筑佣金时间的概率模型
Skills
Languages
Python, Python 3, SQL, Bash, R, c++
库/ api
Pandas, NumPy, CatBoost, Scikit-learn, XGBoost, PyMC, LSTM, SciPy, SQLAlchemy, PyTorch, PySpark, OpenCV, wxWidgets, Dask, TensorFlow, Keras, Spark ML, GraphX, Telegram Bot API, Telegram Messenger API, Asyncio, Python Asyncio, 谷歌语音API, 谷歌API, 谷歌api, 硒API, Mypy, Slack API, 条纹API, Stripe
Tools
Jupyter, 亚马逊SageMaker, Git, MATLAB, Plotly, AWS CLI, Jira, Confluence, Apache气流, AWS CloudFormation, 码头工人组成, GIS, Spark SQL, PyCharm, Subversion (SVN), CircleCI, 亚马逊EBS, Tableau, Grafana, 亚马逊监测, Amazon Elastic Container Registry (ECR), Kibana, GitHub, Pytest, pylint, MongoDB Shell
Paradigms
数据科学,ETL,异常检测,商业智能(BI),目标 & 关键结果(OKRs), 系统动力学, DevOps, 持续部署, 持续集成(CI), 持续交付(CD), 单元测试
Platforms
MacOS, Amazon EC2, 亚马逊网络服务(AWS), Jupyter笔记本, Linux, Docker, AWSλ, Visual Studio Code (VS Code), Apache卡夫卡, AWS Elastic Beanstalk, 谷歌云平台(GCP), 砖, Azure, 区块链
Storage
Amazon S3 (AWS S3), 数据管道, 数据验证, Databases, Apache蜂巢, PostgreSQL, 数据集成, 谷歌云, MongoDB, Elasticsearch, JSON, 亚马逊DynamoDB, Datadog, Redis
Other
数据分析,机器学习,贝叶斯推理 & Modeling, 时间序列, 正则表达式, 数学, 数学建模, 贝叶斯统计, 人工智能(AI), MLflow, 预测建模, 数据可视化, 算法, ARIMA, GeoJSON, GeoPandas, APIs, Cloud, 数据分析, Research, 自然语言处理(NLP), 机器学习操作(MLOps), 编程, 线性回归, 随机森林, 随机森林回归, 数据建模, ARIMA模型, SARIMA, 预测, 数学分析, 马尔可夫模型, CSV, 亚马逊机器学习, GPT, 生成预训练变压器(GPT), OpenAI GPT-4 API, CI / CD管道, 大型语言模型(llm), LangChain, 检索增强生成(RAG), 神经网络, 数据处理, 预测分析, 统计数据, Big Data, 工程数据, 数据架构, 方差分析(ANOVA), 软件架构, 解决方案架构, 用户定义函数(UDF), 深度神经网络, 深度学习, 拥抱的脸, Azure砖, 计算机视觉, 语言模型, 数据匹配, Prefect, 统计分析, 软件开发, 技术领导, 完整的, 体系结构, ChatGPT, OpenAI, API集成, OpenAI GPT-3 API, Chatbots, PDF刮, 生成式人工智能(GenAI), Llama 2, 数据抓取, 生成的人工智能, 嵌入式开发, 脑机接口, 三维扫描, 三维重建, Vowpal Wabbit, Dash, 优化, Amazon RDS, Metabase, Airtable, Dagster, Analysis, 数据争吵, Modeling, 机器视觉, OCR, 数据推理, ETL Tools, 数据准备, 信号处理, 医学成像, EEG, 面向Python的EEG库, Science, 生命科学, Software, 三角洲湖, Parquet, 星型模式, FAISS, 递归神经网络(rnn), Monday.com, 图像处理, 推荐系统, 生成预训练变压器3 (GPT-3), 手写识别, 模式匹配, 数据构建工具(dbt), 制造业, 计算机科学, 以太坊智能合约, 聪明的合同, 决策树回归, 文本生成, 代码生成器, DreamBooth, 稳定的扩散, ControlNet, 微调, 谷歌云机器学习, 亚马逊的理解, 电报机器人, 异步/等待, 语音到文本的转换, 文本转语音(TTS), 语音识别, 语音合成, AIOps, Amplitude, Railway, Poetry, Flake8, API连接, Apify SDK, Web Search, Dashboards, 用户监控, Analytics, 客户保留, 用户保留, 异步I / O, Coroutines, 条纹支付, Billing
框架
Apache火花, Hadoop, Spark, Flask, Selenium
行业专业知识
Healthcare
Education
数学博士学位
罗蒙诺索夫莫斯科国立大学-莫斯科,俄罗斯
数学硕士学位
罗蒙诺索夫莫斯科国立大学-莫斯科,俄罗斯
认证
2019年机器学习暑期学校
斯科尔科沃科学技术研究所
2018年DeepBayes暑期学校
国立研究型大学高等经济学院
高级科学编程Python 2017
G-Node
俄罗斯数学奥林匹克竞赛二等奖,总成绩第三名
俄罗斯数学奥林匹克委员会
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
开始招聘