重点方向
交通分析与运筹优化
设施选址、车辆路径规划、库存管理、调度、排队系统、供应链优化与仿真模拟
重点方向
设施选址、车辆路径规划、库存管理、调度、排队系统、供应链优化与仿真模拟
重点方向
强化学习、生成式模型、贝叶斯推断、计算机视觉、自然语言处理
重点方向
数据库系统、大数据流水线、分布式系统、HPC 与分析基础设施
作品集
交通 / OR
设计并实现支持固定线路、动态拼车与融合运营模式的公交调度引擎,旨在提升车队利用率并缩短乘客出行时间。核心工作包括构建并求解实时路径规划模型——涵盖用于动态巡游的开放式集送一体化 TSP (PDP-TSP),以及用于分段式线路偏移的固定端点 TSPP。
围绕 Columbia Evening Shuttle 开展基于混合方法的车队规模估计研究。将解析式 M/M/s 排队模型基准与基于智能体 (ABM) 的仿真相结合,深入分析不同调度策略对乘客等待时间、车辆行驶距离及司机利用率的综合影响。
针对芝加哥 Divvy 共享单车网络构建混合整数规划 (MIP) 模型,以科学优化单车投放量、站点选址部署及基于价格动态考量的站点运营管理策略。
构建混合整数规划模型以消除纽约市“托儿沙漠”现象。在兼顾邮编级服务覆盖率、特定年龄段容量及设施间距限制的约束下,优化新建托育设施的选址部署与现有机构的容量扩充策略,实现预算成本最小化。
为纽约飞往伦敦的跨大西洋航班制定航空餐食每日最优订购策略。在面临乘客需求高度不确定的前提下,通过动态规划综合权衡易腐生鲜食材、可复用零食包、缺货补偿券、固定订购成本、库存持有成本及机舱空间容量限制等复杂因素。
构建基于每周动态更新的末端配送优化模型,用于纽约市半挂车移动枢纽的选址部署与社区级需求分配。在综合考量配送成本的不确定性与运力短缺惩罚的约束下,实现挂车运力容量的精细化管理。
为服务多港口的油轮船队制定季度航线规划与装载策略。该项目将车辆路径规划 (VRP) 与动态装载决策深度结合,在应对随机航行时间、港口需求不确定性及国际油价波动的复杂环境中实现船队整体收益最大化。
为 24/7 全天候运营的 GPU 翻新仓库设计日前人员排班规划模型。通过样本平均近似 (SAA) 等方法,在零工出勤率随机波动、生产效率不确定、基础人力成本及高昂的溢出补位成本之间实现最优的风险与成本权衡。
为 LLM 推理数据中心设计基于排队论的服务器动态启停调度策略。在面对请求随机到达与排队系统动态特征时,实现电力能源成本、系统内存开销与 SLA 违约惩罚/网络拥塞损失之间的有效平衡。
为涵盖生产、转售与终端零售节点的多级饮料供应链网络构建生产规划模型。该模型结合报童模型 (Newsvendor Model) 的利润最大化函数、节点产能限制、设施间需求传导效应及外部随机需求,科学制定网络全局最优月度生产计划。
机器学习
独立实现并深入研究了用于高质量图像生成的去噪扩散模型 (Denoising Diffusion Models) 及基于时间步条件的 U-Net (Time-conditioned U-Net) 核心架构。
使用 Python 从零构建了一系列概率机器学习与统计推断算法,核心涵盖:贝叶斯线性回归、隐马尔可夫模型 (HMM)、吉布斯采样、期望最大化 (EM) 算法、坐标上升变分推断 (CAVI)、变分自编码器 (VAE)、基于平均场变分推断的泊松矩阵分解、变量消除以及前向-后向推断。
将先进的计算机视觉技术应用于工业制造流水线的产品质量检测。该项目综合运用了图像纹理特征提取、深度卷积神经网络 (CNN) 及模型可解释性分析方法 (如 SHAP),以显著提升表面缺陷识别的准确率与模型透明度。
这是一个极具现实意义的自然语言处理 (NLP) 实践项目,通过构建深度神经网络架构与基于 Transformer 的前沿语言建模技术,精准检测并拦截社交媒体平台上的自动化灌水及恶意机器账号。
将机器学习中的监督学习算法引入信用卡欺诈交易的风控检测体系,全面评估并横向对比了决策树、K-近邻 (KNN)、逻辑回归等主流分类器在海量非平衡数据下的异常识别性能。
系统 / 数据工程
综合运用 PyArrow、Docker 容器化、HDFS、Apache Spark 分布式计算框架、HBase、Cassandra 分布式存储系统及 Kafka Streams,端到端构建具备高容错与可扩展性的流批一体化现代数据工程流水线。
深入研习复杂 SQL 查询执行计划与优化策略,并使用 C++ 从底层手工实现关系型数据库管理系统 (RDBMS) 的核心内部机制,重点覆盖缓冲池管理器 (Buffer Management) 调度逻辑与各类物理连接算法 (Join Algorithms)。
这是一个面向高性能计算 (HPC) 场景的数字广告追踪反欺诈项目。依托威斯康星大学麦迪逊分校基于 HTCondor 构建的分布式集群计算环境,高效完成极大规模行为日志数据的并行预处理、特征工程与分布式模型训练实验。
其他
自主规划并开发了一款交互式多维地理空间数据可视化平台,动态关联气候极端预测、人口演变趋势、土地利用状况、住房密度及城市边界扩张路径。该工具支持用户沉浸式对比 RCP 4.5 与 RCP 8.5 两种典型温室气体排放情景下,长达数十年的时空演化分析。
产品展示 → 基于纽约州数据渲染的交互演示面板
运用方差分析 (ANOVA) 与 Fisher 最小显著性差异法 (LSD) 等严谨的数理统计框架,主导完成的结构化实验设计 (DOE) 与控制变量数据解析实践项目。
深度聚焦美国传统肉类加工行业,运用微观经济学原理与计量模型,深入剖析头部寡头市场集中度不断攀升与行业平均利润率波动之间违背常规直觉的深层经济学“悖论”规律。
这是一个交叉学科的应用计量经济学与公共卫生数据分析项目。旨在通过多重回归与假设检验,科学量化并全面考察多项宏观及微观社会经济学核心变量对美国境内 HIV 地方发病率的潜在驱动作用机制。
基于北美职业冰球联赛 (NHL) 现役及历史球员的关键赛场表现数据集,运用现代 R/Python 数据科学工具包独立完成的探索性数据分析 (EDA) 与交互式信息图表可视化展示项目。