more >>比赛链接:https://www.kaggle.com/c/seti-breakthrough-listen
比赛名称:SETI Breakthrough Listen - E.T. Signal Search
比赛内容:利用算法来识别异常的信号,CV类型赛题
more >>比赛链接:https://www.kaggle.com/c/seti-breakthrough-listen
比赛名称:SETI Breakthrough Listen - E.T. Signal Search
比赛内容:利用算法来识别异常的信号,CV类型赛题
more >>记录一次kaggle比赛,这次比赛的场景主要通过MLB球员的历史表现数据、社交媒体数据以及市场规模等团队因素来预测在未来MLB 球员的数字内容互动趋势(社交媒体互动)。建立的模型将预测出MLB球员在未来的数字内容互动趋势指数(target1- target4)。
more >>一维FFT算法在Maxwell架构上,归为访存密集算法。
即,在足够优化的情况下,可在一次memory copy的耗时内完成计算。本文实现的FFT算法达到与官方库cuFFT一致的速度,通过整合kernel,可实现比调用CUFFT更快的算法整体执行速度。在处理65536*4以上大点数一维FFT+IFFT计算时(一个大核心共享内存放不下完整的一维FFT数据),组合算法可以实现比CUFFT少2个kernel调用的时间(减少两次显存数据交换),主要说明4096点FFT算法设计的思路及实现。大点数仅说明方法和测试结果。
more >>SGEMM:Single precision floatiing General Matrix Multiply
本文的SGEMM实现思路整理于MaxAs wiki和对MaxAs项目SGEMM汇编代码的理解。
MaxAs是一个开源的Maxwell架构GPU汇编器: Github链接
作者Scott Gray提到两篇相关论文MAGMA paper和Kepler sgemm paper
more >>随着海量数据的出现和模型参数的增多,我们必然需要更大的集群来运行模型,这样最大的好处在于把原本可能需要周级别的训练时间缩短到天级别甚至小时级别。未来的模型训练面对的都是上亿数据和上亿参数,稳定的计算能力和管理便捷的集群环境至关重要。Kubernetes 是目前应用最广泛的容器集群管理工具之一,它可以为对分布式TensorFlow 的监控、调度等生命周期管理提供所需的保障。
more >>CUDA是一种通用的并行计算平台和编程模型,是在C语言上扩展的。借助于CUDA,你可以像编写C语言程序一样实现并行算法。你可以在NIVDIA的GPU平台上用CUDA为多种系统编写应用程序,范围从嵌入式设备、平板电脑、笔记本电脑、台式机工作站到HPC集群。在CUDA编程平台中,GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,可以看成是CPU的协处理器,因此当我们在说GPU并行计算时,其实是指的基于CPU+GPU的异构计算架构。在异构计算架构中,GPU与CPU通过PCIe总线连接在一起来协同工作,CPU所在位置称为为主机端(host),而GPU所在位置称为设备端(device)。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true