• 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    酥酥的温柔乡
    酥酥的温柔乡
    • 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    搜索
    随机换张背景
    avatar
    登录 注册
    header_user_avatar
    登录

    梦回温柔乡

    疯狂造句中......

    莫贪几两钱 误了月儿圆

  • WeChat QR Code
  • QQ QR Code
  • bilibili
  • cloudmusic
  • github
  • zhihu
  • E-mail
  • post_img
    发布于 6 天前
    18 热度 无~ 技术交流

    DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss?

    摘要

    DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss? 一、DPO是什么? DPO(Direct …

    post_img
    发布于 7 天前
    19 热度 无~ 技术交流

    有哪些Classifier-Free Guidance的变式工作?

    摘要

    一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …

    post_img
    发布于 7 天前
    19 热度 无~ 技术交流

    Vision Transformer中的Attention热力图可视化原理是什么?

    摘要

    Vision Transformer中的Attention热力图可视化原理是什么? 一、ViT的注意力可视化在做一件什么事情? 实 …

    post_img
    发布于 7 天前
    20 热度 无~ 技术交流

    LoRA在图像生成中有哪些优秀的变式工作?

    摘要

    LoRA在图像生成中有哪些优秀的变式工作? 一、回归定义:LoRA是什么? LoRA(Low-Rank Adaptation)是一 …

    post_img
    发布于 7 天前
    14 热度 无~ 技术交流

    Diffusion和Autoregressive做生成哪个上限更高?

    摘要

    Diffusion和Autoregressive做生成哪个上限更高? 先说结论:没有绝对的上限最高,这里都要结合具体的语境来进行讨 …

    post_img
    发布于 7 天前
    13 热度 无~ 技术交流

    Training-free的多模态大模型研究方向目前有哪些比较适合学生?

    摘要

       Training-free的多模态大模型研究方向目前有哪些比较适合学生? 一、前言 开始之前,说说自己对training-f …

    post_img
    发布于 8 天前
    15 热度 无~ 技术交流

    如何看待「多模态大模型的幻觉缓解」这一方向?

    摘要

    如何看待「多模态大模型的幻觉缓解」这一方向? 一、MLLM Hallucination在做一件什么事情? Hallucinatio …

    post_img
    发布于 16 天前
    23 热度 无~ 文字控

    初一,见了一些多年未见的老同学,才发现读博这几年人生仿佛按下了暂停键,很多同龄人已经工作落定,有房有车,结婚生子……

    摘要

    在学校里面待久了,对很多东西没概念,总觉得自己还是学生,即便到了一定年纪,也不觉得需要考虑太多事情,感觉离自己还很遥远,但是回了老 …

    post_img
    发布于 16 天前
    34 热度 无~ 文字控

    对于读博群体来说,最应该感谢的是自己的家庭,哪有什么岁月静好,不过是有人在负重前行

    摘要

    “我不必费力解释为什么三十岁还不急着结婚,为什么选择清贫但热爱的学术道路,为什么享受独处胜过热闹聚会,博士身份成了最便捷的解释理由 …

    post_img
    发布于 16 天前
    34 热度 无~ 技术交流

    扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重?

    摘要

    扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重? 一、Diffusers中的代码实现是怎样的? 在Di …

    更早的文章
    loading_svg

    互联网ICP备案:浙ICP备2021031116号-2

    加载耗时 0.271 秒 | 查询 93 次 | 内存使用 16.40 MB

    Theme Sakurairo by Fuukei

    attention (6) causal (3) css (4) datetime (4) deeplearning (57) deepseek (3) diffusers (3) Diffusion (7) Django (18) excel (7) html (4) JavaScript (2) life (3) LLM (11) middleware (2) numpy (3) orm (4) OS (13) pandas (4) PPO (3) python (112) reinforcement learning (5) RLHF (3) scrapy (12) sklearn (12) Stable Diffusion (4) tableau (4) torch (46) transformer (5) vba (3) yolo (4) 人生 (3) 冬季星空 (5) 夏夜星空 (4) 大模型 (7) 大语言模型 (6) 天文 (35) 强化学习 (8) 思考 (47) 扩散模型 (28) 教育 (7) 教育学 (3) 文字 (4) 爬虫 (6) 生成式人工智能 (8)