申请
应用研究算法工程师
姓名
:
L先生
顾问面试
:
擅长领域
:
领域
职位
: 应用研究算法工程师
最高学历
:
硕士
北京工业大学
沟通情况
:
新鲜出炉
面议
目前住址
:
求职区域
:
考虑公司类型
: 不限
考虑公司行业
: 不限
接受工作强度
: 不限
个人情况
: 1991出生 男 未婚
候选人优势
:
工作经验
腾讯 PCG 推荐产品中心 预估模型组
在职时间
: 2018-5 至今
职位
: 应用研究算法工程师
工作职责
: 快报主 TL recall(召回): 负责天天快报主 TL 的视频&图文召回,根据用户历史点击数据、用户画像、图文;视频的属性数据,定义 user-user,item-item 之间的相似度关系,最终根据用户近期的点击和负反馈行为,进行实时的在线召回。 主要应用算法:word2vec/doc2vec/node2vec embedding 算法、传统协同过滤 ICF/OICF/ALS 等、基于 DSSM 的 embidding 算法、基于 bandit 的新热内容召回 快报主 TL CTR ranking (精排): 线上 ctr ranking 采用开源的 dmlc 库,小时级的模型更新和天级别数据的模型修正,针对 ctr 和观看时长两个目标,ranking 进行了如下优化:根据特征的信息熵重新选择有效的单特征;设计和实现交叉特征;设计统计特征并进行离散化;针对正负样本比例不均问题,调整 dmlc-liner 的损失函数;为弥补单纯的 ctr 模型存在的问题,将观看时长素融合到 label 和 loss 计算逻辑中,优化主 TL 场景的整体生态 优化现有的 ranking 工程和指标,主要包括:排查 ranking 线上线下特征一致性问题;添加线上 auc 监控数据;优化 ranking 训练数据的上报逻辑,从而提升训练数据的质量和实效性 快报主 TL rerank(重排): 结合 ranking 和 recall 结果并配合业务和产品逻辑,设计和实现重排策略算法。主要工作:根据用户最近的曝光点击行为,动态调节视频和图文的配比和槽位、利用 bandit 的思想结合用户兴趣,对 rerank 阶段的可调参数进行自动寻优、根据 item 的时长统计数据设计公式,融合 ctr 和观看时长
京东 商业提升事业部.数据部
在职时间
: 2016-6 至 2018-4
职位
: 算法工程师
工作职责
: SEM 搜索词分类: 利用归一化熵的概念结合京东主站的搜索数据,对接入的 sem 搜索词进行类目划分利用图算法挖掘异常订单和实体:利用 spark GraphX 实现游标传播算法、连通图和 pagerank。 基于已有的少部分 label 数据,挖掘异常的订单和实体集合;模型识别量为线上异常订单的两倍 利用 GBDT/k-means/DBscan 识别虚假订单: 将订单的评论数据作为特征,通过 k-means 对已有的少量标注数据进行样本扩展,基于 spark mllib 来识别评论订单中的虚假订单;模型上线后为线上带来了约15%的增量 深度学习识别虚假订单: 基于京东广告部的深度学习工具,设计和实现 LOSS 函数,利用 python、shell、spark、pig、oozie 实现模型训练和预测的整条 pipline;模型上线后为线上带来了约 35%的增量 Weekly BadCase 分析: 分析运营侧每周返回的模型 bad case(漏识别、误识别、特殊业务场景),主要从模型识别情况(GBDT 的判定路径)、BadCase 的基础数据分析、特殊业务场景的 case 分析劣质评论识别:通过规则来定义某些劣质评论,如:重复字、词占比大于 80%;情感词占比大于 80%; 基于 TF-IDF(W2V、朴素贝叶斯)的评论-类目相关性过滤; 基于 TF 的虚假订单识别:利用 TF 实现 DNN 和 lstm 算法,针对虚假订单的不同场景进行识别。针对连续特征使用 DNN 的全连接网络进行识别;针对评论数据,采用 lstm+连续特征的网络结构进行识别。
教育/培训经历
北京工业大学
时间
: 2013-9 至 2016-6 硕士
北京工业大学
时间
: 2009-9 至 2013-7 本科
申请安排面试
X