项目

重点方向

交通分析与运筹优化

设施选址、车辆路径规划、库存管理、调度、排队系统、供应链优化与仿真模拟

重点方向

机器学习与统计建模

强化学习、生成式模型、贝叶斯推断、计算机视觉、自然语言处理

重点方向

数据工程与 DBMS

数据库系统、大数据流水线、分布式系统、HPC 与分析基础设施

动态

作品集

项目经历

交通 / OR

交通分析与运筹优化

10 个项目

多场景公交调度与实时路径规划引擎

设计并实现支持固定线路、动态拼车与融合运营模式的公交调度引擎,旨在提升车队利用率并缩短乘客出行时间。核心工作包括构建并求解实时路径规划模型——涵盖用于动态巡游的开放式集送一体化 TSP (PDP-TSP),以及用于分段式线路偏移的固定端点 TSPP。

公交调度 动态路径规划 PDP-TSP TSPP

Chicago Divvy 共享单车网络供给与站点运营优化

针对芝加哥 Divvy 共享单车网络构建混合整数规划 (MIP) 模型,以科学优化单车投放量、站点选址部署及基于价格动态考量的站点运营管理策略。

设施选址 单车调配 IP/MIP 定价优化

解决纽约市托育服务短缺:预算最小化的选址部署与扩容模型

构建混合整数规划模型以消除纽约市“托儿沙漠”现象。在兼顾邮编级服务覆盖率、特定年龄段容量及设施间距限制的约束下,优化新建托育设施的选址部署与现有机构的容量扩充策略,实现预算成本最小化。

设施选址 容量扩展 MIP 公共服务可达性规划

航空餐食单期库存优化

为纽约飞往伦敦的跨大西洋航班制定航空餐食每日最优订购策略。在面临乘客需求高度不确定的前提下,通过动态规划综合权衡易腐生鲜食材、可复用零食包、缺货补偿券、固定订购成本、库存持有成本及机舱空间容量限制等复杂因素。

单期库存模型 库存控制 易腐库存 动态规划

纽约市末端配送移动挂车枢纽选址与需求分配

构建基于每周动态更新的末端配送优化模型,用于纽约市半挂车移动枢纽的选址部署与社区级需求分配。在综合考量配送成本的不确定性与运力短缺惩罚的约束下,实现挂车运力容量的精细化管理。

有容量设施选址 末端物流 随机需求

跨港口油轮船队路径规划与装载决策优化

为服务多港口的油轮船队制定季度航线规划与装载策略。该项目将车辆路径规划 (VRP) 与动态装载决策深度结合,在应对随机航行时间、港口需求不确定性及国际油价波动的复杂环境中实现船队整体收益最大化。

车辆路径规划 装载规划 随机旅行时间

不确定环境下的 24/7 仓库人员排班

为 24/7 全天候运营的 GPU 翻新仓库设计日前人员排班规划模型。通过样本平均近似 (SAA) 等方法,在零工出勤率随机波动、生产效率不确定、基础人力成本及高昂的溢出补位成本之间实现最优的风险与成本权衡。

随机排班 人员规划 样本平均近似 (SAA)

大语言模型 (LLM) 推理数据中心服务器动态调度

为 LLM 推理数据中心设计基于排队论的服务器动态启停调度策略。在面对请求随机到达与排队系统动态特征时,实现电力能源成本、系统内存开销与 SLA 违约惩罚/网络拥塞损失之间的有效平衡。

排队系统 动态容量控制

多级饮料供应链网络生产规划

为涵盖生产、转售与终端零售节点的多级饮料供应链网络构建生产规划模型。该模型结合报童模型 (Newsvendor Model) 的利润最大化函数、节点产能限制、设施间需求传导效应及外部随机需求,科学制定网络全局最优月度生产计划。

多级网络 生产规划 报童模型

机器学习

机器学习与统计建模

5 个项目

基于时间步条件的 U-Net MNIST 图像扩散模型

独立实现并深入研究了用于高质量图像生成的去噪扩散模型 (Denoising Diffusion Models) 及基于时间步条件的 U-Net (Time-conditioned U-Net) 核心架构。

扩散模型 U-Net 生成式机器学习

概率机器学习与变分推断算法全集实现

使用 Python 从零构建了一系列概率机器学习与统计推断算法,核心涵盖:贝叶斯线性回归、隐马尔可夫模型 (HMM)、吉布斯采样、期望最大化 (EM) 算法、坐标上升变分推断 (CAVI)、变分自编码器 (VAE)、基于平均场变分推断的泊松矩阵分解、变量消除以及前向-后向推断。

贝叶斯推断 潜变量模型 变分推断

基于计算机视觉的制造业产品质量缺陷检测

将先进的计算机视觉技术应用于工业制造流水线的产品质量检测。该项目综合运用了图像纹理特征提取、深度卷积神经网络 (CNN) 及模型可解释性分析方法 (如 SHAP),以显著提升表面缺陷识别的准确率与模型透明度。

计算机视觉 CNN SHAP (可解释性分析)

在线 Twitter 机器人账号自动识别与检测

这是一个极具现实意义的自然语言处理 (NLP) 实践项目,通过构建深度神经网络架构与基于 Transformer 的前沿语言建模技术,精准检测并拦截社交媒体平台上的自动化灌水及恶意机器账号。

NLP Transformer 文本分类

信用卡欺诈交易检测系统建模探索

将机器学习中的监督学习算法引入信用卡欺诈交易的风控检测体系,全面评估并横向对比了决策树、K-近邻 (KNN)、逻辑回归等主流分类器在海量非平衡数据下的异常识别性能。

监督学习 异常与欺诈检测 分类器

系统 / 数据工程

数据工程与 DBMS

3 个项目

现代大数据基础设施与系统构建

综合运用 PyArrow、Docker 容器化、HDFS、Apache Spark 分布式计算框架、HBase、Cassandra 分布式存储系统及 Kafka Streams,端到端构建具备高容错与可扩展性的流批一体化现代数据工程流水线。

PyArrow Apache Spark Kafka Streams Cassandra

数据库管理系统 (DBMS):架构设计与底层实现

深入研习复杂 SQL 查询执行计划与优化策略,并使用 C++ 从底层手工实现关系型数据库管理系统 (RDBMS) 的核心内部机制,重点覆盖缓冲池管理器 (Buffer Management) 调度逻辑与各类物理连接算法 (Join Algorithms)。

SQL C++ 缓冲池管理 物理连接算法

基于 HPC 集群的移动广告点击欺诈分析 (AdTracking)

这是一个面向高性能计算 (HPC) 场景的数字广告追踪反欺诈项目。依托威斯康星大学麦迪逊分校基于 HTCondor 构建的分布式集群计算环境,高效完成极大规模行为日志数据的并行预处理、特征工程与分布式模型训练实验。

HPC HTCondor 广告欺诈检测

其他

数据分析与可视化

5 个项目

气候—人口演变交互与建成环境的多维时空可视化系统

自主规划并开发了一款交互式多维地理空间数据可视化平台,动态关联气候极端预测、人口演变趋势、土地利用状况、住房密度及城市边界扩张路径。该工具支持用户沉浸式对比 RCP 4.5 与 RCP 8.5 两种典型温室气体排放情景下,长达数十年的时空演化分析。

地理空间可视化 气候分析与建模 栅格数据处理 建成环境

基于 ANOVA 的科学实验设计与统计解析

运用方差分析 (ANOVA) 与 Fisher 最小显著性差异法 (LSD) 等严谨的数理统计框架,主导完成的结构化实验设计 (DOE) 与控制变量数据解析实践项目。

方差分析 (ANOVA) Fisher LSD 实验设计 (DOE)

美国社会经济变量与地方 HIV 流行病发病率关联机制研究

这是一个交叉学科的应用计量经济学与公共卫生数据分析项目。旨在通过多重回归与假设检验,科学量化并全面考察多项宏观及微观社会经济学核心变量对美国境内 HIV 地方发病率的潜在驱动作用机制。

应用数据分析 公共卫生计量 计量经济学

北美职业冰球联赛 (NHL) 球员表现统计指标多维图解

基于北美职业冰球联赛 (NHL) 现役及历史球员的关键赛场表现数据集,运用现代 R/Python 数据科学工具包独立完成的探索性数据分析 (EDA) 与交互式信息图表可视化展示项目。

探索性数据分析 (EDA) 信息可视化 体育商业数据分析