端到端国产化AI集合通信系统,涵盖网卡、线缆与交换机,通过软硬件联合设计,优化算法、工艺与供应链,以系统带动芯片发展,实现硬件开放生态,软件自主可控;
智算中心建设运维自动化平台,面向数十万组件构成的集群,以软件定义机制,构建仿真、配置、测试、校验的自动化交付流程,以超可观测性能力,支持超大规模集群维护与故障定位;
一体化算力网络调度优化平台,针对分布式大规模集群规模横向扩展的效率与利用率问题,研发十万卡集群的分布式并行计算框架、广域互联和任务调度关键技术。
在市场拓展方面,携手芯片、设备、数据中心等行业伙伴,为客户快速高效稳定交付智算集群,提供专业的运维与调优服务。
在团队建设方面,持续吸引和培养一批高水平复合型人才,持续建设并沉淀能够支撑团队中长期发展的能力。
基流科技成立于2023年2月,源自清华大学网络安全实验室,团队攻克AI基础设施的分布式计算通信难题,在高速组网、集合通信、并行框架、管控调度等方面形成了一系列关键技术。基流科技成员来自清华、北大、北邮、北航等一线高校半岛bandao体育,,以及阿里、美团、中兴等互联网和设备厂商,其中多名成员有超过二十年产研经验。
自成立以来,公司已落地百卡、千卡到万卡集群,累计建设调优十余个集群,FP16算力超过40EFLOPs。公司已服务包括智谱AI、商汤科技半岛bandao体育,、数据中心、运营商、地方国企在内的多个头部用户。
在建设运维方面,公司已具备30天内稳定交付数千卡集群、60天内稳定交付数万卡集群的建设调优能力与案例;通过层级式冗余设计与自动化平台加持,公司实现单月硬件层SLA(服务等级协议)超99.95%。
在性能优化方面,通过计算与通信的跨层优化,公司已实现单任务单集群训练迭代时间降低10%以上,单任务多集群(50km)等效算力超过98%。返回搜狐,查看更多半岛bandao体育,半岛bandao体育,半岛bandao体育,