探秘Transformer系列之(18)— FlashAttention

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

探秘Transformer系列之(18)--- FlashAttention 目录 0x00 概述 0.1 问题 0.2 其它解决方案 0.3 Flash Attention 0x01 背景知识...

从零开始开发一个 MCP Server!

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

大家好!我是韩老师。 最近,在 AI 开发领域,MCP (Model Context Protocol) 是越来越火了! 前几天,我我也开发了一款 Code Runner MC...

【调研】Vision Language Model Safety

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

Adversarial Attacks White-box Attacks Task-specific Attacks 的目标是针对某个具体的任务(如图像描述生成、指代表达理解等),通...

AI+Web3:张三的未来机会地图

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

热点风暴:ETHDenver 2025掀起热潮 滑动微信的那一刻,张三愣住了。热搜上,ETHDenver大会简直是技术圈的春晚。AI和Web3,这两个曾经...

模型即产品?从应用角度看AI产品发展趋势

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

提供AI咨询+AI项目陪跑服务,有需要回复1 在ChatGPT发布后的两年里,AI应用层的发展可以用一个词来评价不温不火,到去年年初时甚至有...

nacos(八): sentinel——基本使用

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

一、概要 在微服务的架构中,流控是一个重要的任务。sentinel是阿里开源的流量治理组件,针对访问的“资源”或服务路径进行流控,内置了...

知识蒸馏实战

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

蒸馏实战小实验 本实验相关代码已开源至github 失败经历 爱爱医数据蒸馏Qwen2.5-7B 1.用爬虫在爱爱医网站爬取1k条数据。(刚学一点爬虫...

张高兴的大模型开发实战:(三)使用 LangGraph 为对话添加历史记录

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

目录 基础概念 环境搭建与配置 将对话历史存储至内存 将对话历史存储至 PostgreSQL 在构建聊天机器人时,对话历史记录是提升用户体...

入门Dify平台:知识库分析

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

今天,我们来简单了解一下 Dify 的知识库功能。其实,它并没有想象中那么复杂或难以操作。无论是 Dify 还是其他类似平台,都已经将知识...

LLM应用落地实施手册

技术分享 技术分享 1年前 (2025-03-26) 999+ 0

背景 自ChatGPT诞生以来,各个企业都开始尝试引入LLM落地实施“智能”应用,而目前并没有太多文章系统地介绍应该怎么落地实施一个基于LLM...