作者华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员、腾讯高级研究员,《Python 大战机器学习》的作者。

这是作者多年以来学习总结的笔记,经整理之后开源于世。目前还有约一半的内容在陆续整理中,已经整理好的内容放置在此。 曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此作者采取开源的形式。 笔记内容仅供个人学习使用,非本人同意不得应用于商业领域。

笔记内容较多,可能有些总结的不到位的地方,欢迎大家探讨。联系方式:huaxz1986@163.com qq: 525875545

另有个人在 github 上的一些内容:

20230524 修订:

  • 新增 Transformer 7、8、9 三章,包括:《Scaling Laws for Neural Language Models》、 《Training Compute-Optimal Large Language Models》、LLaMA、GLM、GLM-130B、 GPT-NeoX-20B、Bloom、PaLM、PaLM2、Self-Instruct 等十篇论文。
  • 20230516 修订:

  • 新增 HuggingFace Transformer 应用、Gradio。 所有 HuggingFace Transformer 官方教程和 API , 包括 Tokenizer、Dataset、Trainer、Evaluator、Pipeline、Model、Accelerate、AutoClass、应用,等九章内容
  • 历史更新请参考 这里

    数学基础

    统计学习

    深度学习

    工具

    CRF

    lightgbm

    xgboost

    scikit-learn

    spark

    numpy

    scipy

    matplotlib

    pandas

    huggingface_transformer

    Scala