Skip to content

Latest commit

 

History

History
16 lines (11 loc) · 468 Bytes

File metadata and controls

16 lines (11 loc) · 468 Bytes

特征工程

在深度学习喧嚣的背景之下,经常能够听到对特征工程的批评,“问题相关,需要领域知识”,

  • 标准化

    • 作用
      1. 避免大数属性主导
      2. 避免计算中的数值困难(中间结果膨胀等)
  • BOW(bag of words)

    通常被翻译为词袋法,但其实它是一个通用的特征生成方法,并不局限在自然语言处理中。例如,图像识别中,

  • TF-IDF