相关文章推荐
↑↑↑关注后" 星标 " kaggle竞赛宝典
kaggle竞赛宝典 作者:Kmat

Child Mind Institute- Detect Sleep States大赛第二名方案!

简介

Kaggle最新比赛Child Mind Institute - Detect Sleep States已结束,这是一道关于序列的问题,在阅读前排的方案时,第二名的策略的思路中有非常多值得借鉴的想法,其中包括如何使NN模型在该类问题中得到稳定的训练,如何处理NN在长时间周期问题预测上的不足的问题,还有使用ML模型对多个Events预测进行融合处理的思路,都非常值得学习借鉴。

  • 对数据进行预处理与特征工程
  • 使用1DCNN(U-NET)的进行事件检测和Sleep/Awake分类
  • 对1D CNN的后处理(如峰值检测)
  • 使用ML进行后处理
  • 考虑到每天2次事件的限制的,使用LGBM进行分数的纠正
  • 基于基本预测进行step的shift,预测尽可能多的事件。
  • 使用LGBM对生成的预测进行打分;
  • 使用averaging和WBF集成
  • 1. 阶段1: 事件检测&Sleep/Awake分类

    对特征进行一些预处理之后,直接使用U-Net, Deep pyramid网络进行建模,

    事件检测,使用Peak检测寻找事件的steps,如果状态是负向变化的,那么就是onset,否则就是wakeup。

    阶段2:考虑到每天2个事件的限制,我们需要对自信度进行重新算分

    二阶段的设计主要是因为下面两个原因。

    1、 每天少于2个Events

    第一阶段神经网络并不能考虑比赛的这个重要的限制,即一天中最多发生两次事件。例如下面这个例子:

    A) The third candidate in a day with a confidence score of 0.20.
    B) The first candidate in a day witha confidence score of 0.19.

    在很多情况下,B的结论比A要重要很多。

    2、长周期特征:

  • 网络较难处理原始的特征以及长周期的特征 ,例如:

  • 他可以比平时睡的更长,这可能并不是实际上的醒着;
  • 这样的onset和其它天比起来比较模糊;
  • 阶段3:考虑加入更多的事件

  • 2 个CNN 模型
  • 对10(5fold x 2seed) 个模型预测结果求均值;
  • 对每个模型运行2nd stage模型;
  • 对2个模型进行WBF-like的集成;
  • 运行第三个阶段
  • https://www.kaggle.com/competitions/child-mind-institute-detect-sleep-states/data
  • https://www.kaggle.com/competitions/child-mind-institute-detect-sleep-states/discussion/459627
  • 弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型
  • 华为诺亚&清华:基于认知的万物超分大模型CoSeR
  • 逼真到头发丝,光线可调,Meta推出实时3D头像合成方法
  • 人均6万美元:2024英伟达奖学金名单公布,五位华人入选
  • 谷歌承认Gemini视频是“剪出来”的,想赶超GPT-4想疯了
  • 英伟达危机大爆发!一夜之间,四面楚歌
  • 首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下
  • 大规模神经网络优化:超参最佳实践与规模律
  • Gemini多模态时代开启!DeepMind CEO揭秘超进化体融进AlphaGo,明年面世
  • Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开
  • 谷歌OpenAI大模型巅峰对决!Gemini激战GPT-4,数学代码却惨遭碾压
  • “通识+产业”大模型,“Alaya 元识”的赋能路径
  • ​Alluxio SDK 在 Presto/Trino 中的应用
  • OpenAI承认GPT-4变懒:暂时无法修复
  • 首个开源MoE大模型发布!7Bx8个专家,离GPT-4最近的一集
  • OpenAI内斗第二季:Ilya一周没露面,还请了私人律师
  • 谷歌趁OpenAI内讧重组AI团队,挖来硅谷最高华人高管Bill Jia
  •  
    推荐文章