求助大神这是什么歌5，在clBuildProgram时，RET的返回值为

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>电脑网络 >>求助大神这是什么歌5，在clBuildProgram时，RET的返回值为

求助大神这是什么歌5，在clBuildProgram时，RET的返回值为

来源：蜘蛛抓取(WebSpider) 时间：2016-02-07 06:57 标签：瓷娃娃求助遭推诿

clBuildProgram 编译选项-I找不到头文件路径的问题-中国学网-中国IT综合门户网站
> clBuildProgram 编译选项-I找不到头文件路径的问题
clBuildProgram 编译选项-I找不到头文件路径的问题
转载编辑：李强
为了帮助网友解决“clBuildProgram 编译选项-”相关的问题，中国学网通过互联网对“clBuildProgram 编译选项-”相关的解决方案进行了整理,用户详细问题包括:clBuildProgram函数第四个参数options,我设置的是：&-cl-finite-math-only&-cl-no-signed-zeros&-cl-std=CL1.2&-DVECTOR_SIZE_32&-I/root/OpenCL/并将头文件放在/root/OpenCL/下，可在编译kernel的时候提示找不到头文件。而且，我发现opencl默认头文件目录就是/usr/local/include/,&如果把头文件放在其中，则可以编译通过。或者kernel程序的头文件包含的指明全路径，这样也能通过编译。如&#include&"/root/OpenCL/header.h"。根据这几个现象来看，OpenCL在kernel中include&头文件是可以正常工作，但clBuildProgram的-I选项好像不起作用。有谁遇到同样的问题？怎么解决？谢谢了&。。。，具体解决方案如下：解决方案1：clBuildProgram的编译选项是针对你OpenCL&kernel来的，而不是主机端API。对于kernel而言，没啥头文件这种说法。你这里&-I/root/OpenCL/&&放的应该是主机端执行的函数接口吧？这个应该在你主机端编译器的命令选项中加上。解决方案2：引用&1&楼&zenny_chen&的回复:clBuildProgram的编译选项是针对你OpenCL&kernel来的，而不是主机端API。对于kernel而言，没啥头文件这种说法。你这里&-I/root/OpenCL/&&放的应该是主机端执行的函数接口吧？这个应该在你主机端编译器的命令选项中加上。不是，kernel可以有头文件的解决方案3：引用&2&楼&netxuning&的回复:不是，kernel可以有头文件的难道是你放在root下面运行时OpenCL编译器没有权限访问？你放到其它用户目录试试？解决方案4：引用&3&楼&zenny_chen&的回复:Quote: 引用&2&楼&netxuning&的回复:不是，kernel可以有头文件的难道是你放在root下面运行时OpenCL编译器没有权限访问？你放到其它用户目录试试？谢谢，我再试试通过对数据库的索引,我们还为您准备了：编译结果(就是C语言结果)进行验证,就必须重新编译成汇编结果,并与之前的汇编语言进行对比,一致才说明自己结果的正确性。如果要生成汇编文件,需要设置如下选项: 这样在...===========================================2、编译应汇编文件: 反编译程其实主要析汇编文件我所做反编译结(C语言结)进行验证必须重新编译汇编结并与前汇编语言进行比致才说明自结确性要汇编文件需要设置选项: ...===========================================一般情况下,源程序中所有的行都参加编译。但是有时希望对其中一部分内容只在满足一定条件下才进行编译,即对一部分内容指定编译条件,这就是"条件编译"。(conditional com...===========================================设置编译模式为debug=========================================== /MT 「Project Settings」选择「C/C++」页面标签,然后在「Category」下拉式清单方块中选择「Code Generation」。在「Use Run-Time Library」下拉式清单方块中,可以...===========================================eclipse中有个project的菜单,里面有个build project编译下就可以.这个是因为,必须先编译,才可以,还有就是,如果,你的有scaner 会和vc的方式不一样,你试试就知道了.=========================================== 靠你听谁说得,哪用得著该那 header("Content-type: text/ charset=gbk"); 放在最顶上就可以了。如果是数据库那就在数据库连接文件那写个 mysql_query(&...===========================================执行路由路由通信功能要协调器加载选项也执行路由功能=========================================== debug是调试, 打开window--customize perspective--tool bar visibility找到build configuration,把它勾上就行了。=========================================== #ifdef SYMBOL_1 .... #endif #if defined(SYMBOL_2) ... #else #if defined(SYMBOL_3) .... #else ..... #endif #endif 如此,看一下程序是否能正确编译。一般情况下,是...===========================================
本文欢迎转载，转载请注明：转载自中国学网： []
用户还关注随着OpenCL的普及，现在有越来越多的移动设备以及平板、超级本等都支持OpenCL异构计算。而这些设备与桌面计算机、服务器相比而言性能不是占主要因素的，反而能耗更受人关注。因此，这些移动设备上的GPU与CPU基本都是在同一芯片上（SoC），或者GPU就已经成为了处理器的一部分，像Intel Ivy Bridge架构开始的处理器（Intel HD Graphics 4000开始支持OpenCL），AMD APU等。
因此，在这些设备上做OpenCL的异构并行计算的话，我们不需要像桌面端那些独立GPU那样，要把主存数据通过PCIe搬运到GPU端，然后等GPU计算结束后再搬回到主存。我们只需要将给GPU端分配的显存映射到主机端即可。这样，在主机端我们也能直接通过指针来操作这块存储数据。
下面编写了一个比较简单的例子来描述如何使用OpenCL的存储器映射特性。这个例子在MacBook Air，OS X 10.9.2下完成，并通过Xcode 5.1，Apple LLVM 5.1的编译与运行。硬件环境为：Intel Core i7 4650U, Intel Graphics 5000, 8GB DDR3L, 128GB SSD
这是主机端代码（C源文件）：
#include &stdio.h&
#include &string.h&
#include &stdlib.h&
#include &time.h&
#ifdef __APPLE__
#include &OpenCL/opencl.h&
#include &CL/cl.h&
int main(void)
cl_platform_id platform_id = NULL;
cl_device_id device_id = NULL;
cl_context context = NULL;
cl_command_queue command_queue = NULL;
cl_mem memObj = NULL;
char *kernelSource = NULL;
cl_program program = NULL;
cl_kernel kernel = NULL;
int *pHostBuffer = NULL;
clGetPlatformIDs(1, &platform_id, NULL);
if(platform_id == NULL)
puts("Get OpenCL platform failed!");
goto FINISH;
clGetDeviceIDs(platform_id, CL_DEVICE_TYPE_GPU, 1, &device_id, NULL);
if(device_id == NULL)
puts("No GPU available as a compute device!");
goto FINISH;
context = clCreateContext(NULL, 1, &device_id, NULL, NULL, &ret);
if(context == NULL)
puts("Context not established!");
goto FINISH;
command_queue = clCreateCommandQueue(context, device_id, 0, &ret);
if(command_queue == NULL)
puts("Command queue cannot be created!");
goto FINISH;
// 指定内核源文件路径
const char *pFileName = "/Users/zennychen/Downloads/test.cl";
FILE *fp = fopen(pFileName, "r");
if (fp == NULL)
puts("The specified kernel source file cannot be opened!");
goto FINISH;
fseek(fp, 0, SEEK_END);
const long kernelLength = ftell(fp);
fseek(fp, 0, SEEK_SET);
kernelSource = malloc(kernelLength);
fread(kernelSource, 1, kernelLength, fp);
fclose(fp);
program = clCreateProgramWithSource(context, 1, (const char**)&kernelSource, (const size_t*)&kernelLength, &ret);
ret = clBuildProgram(program, 1, &device_id, NULL, NULL, NULL);
if (ret != CL_SUCCESS)
char buffer[8 * 1024];
printf("Error: Failed to build program executable!\n");
clGetProgramBuildInfo(program, device_id, CL_PROGRAM_BUILD_LOG, sizeof(buffer), buffer, &len);
printf("%s\n", buffer);
goto FINISH;
kernel = clCreateKernel(program, "test", &ret);
if(kernel == NULL)
puts("Kernel failed to create!");
goto FINISH;
const size_t contentLength = sizeof(*pHostBuffer) * 1024 * 1024;
// 以下为在主机端分配输入缓存
pHostBuffer = malloc(contentLength);
// 然后对此工作缓存进行初始化
for(int i = 0; i & 1024 * 1024; i++)
pHostBuffer[i] = i + 1;
// 这里预分配的缓存大小为4MB，第一个参数是读写的
memObj = clCreateBuffer(context, CL_MEM_READ_WRITE | CL_MEM_USE_HOST_PTR, contentLength, pHostBuffer, &ret);
if(memObj == NULL)
puts("Memory object1 failed to create!");
goto FINISH;
ret = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void*)&memObj);
if(ret != CL_SUCCESS)
puts("Set arguments error!");
goto FINISH;
// 做存储器映射
int *pDeviceBuffer = clEnqueueMapBuffer(command_queue, memObj, CL_TRUE, CL_MAP_READ | CL_MAP_WRITE, 0, contentLength, 0, NULL, NULL, &ret);
if(pDeviceBuffer == NULL)
puts("Memory map failed!");
goto FINISH;
if(pDeviceBuffer != pHostBuffer)
// 若从GPU端映射得到的存储器地址与原先主机端的不同，则将数据从主机端传递到GPU端
ret = clEnqueueWriteBuffer(command_queue, memObj, CL_TRUE, 0, contentLength, pHostBuffer, 0, NULL, NULL);
if(ret != CL_SUCCESS)
puts("Data transfer failed");
goto FINISH;
/** 如果主机端与设备端地址不同，我们不妨测试一下设备端存储器的Cache情况 */
// 先测试主机端的时间
int sum = 0;
// 先过一遍存储器
for(int j = 0; j & 1024; j++)
sum += pHostBuffer[j];
time_t t1 = time(NULL);
for(int i = 0; i & 1000000; i++)
for(int j = 0; j & 1024; j++)
sum += pHostBuffer[j];
time_t t2 = time(NULL);
printf("The host delta time is: %f. The value is: %d\n", difftime(t2, t1), sum);
// 测试设备端
// 先过一遍存储器
for(int j = 0; j & 1024; j++)
sum += pDeviceBuffer[j];
t1 = time(NULL);
for(int i = 0; i & 1000000; i++)
for(int j = 0; j & 1024; j++)
sum += pDeviceBuffer[j];
t2 = time(NULL);
printf("The device delta time is: %f. The value is: %d\n", difftime(t2, t1), sum);
// 若主机端与设备端存储器地址相同，我们仅仅做CPU端测试
int sum = 0;
// 先过一遍存储器
for(int j = 0; j & 1024; j++)
sum += pHostBuffer[j];
time_t t1 = time(NULL);
for(int i = 0; i & 1000000; i++)
for(int j = 0; j & 1024; j++)
sum += pHostBuffer[j];
time_t t2 = time(NULL);
printf("The host delta time is: %f. The value is: %d\n", difftime(t2, t1), sum);
// 这里指定将总共有1024 * 1024个work-item
ret = clEnqueueNDRangeKernel(command_queue, kernel, 1, NULL, (const size_t[]){1024 * 1024}, NULL, 0, NULL, NULL);
// 做次同步，这里偷懒，不用wait event机制了～
clFinish(command_queue);
for(int i = 0; i & 1024 * 1024; i++)
if(pDeviceBuffer[i] != (i + 1) * 2)
puts("Result error!");
puts("Compute finished!");
/* Finalization */
if(pHostBuffer != NULL)
free(pHostBuffer);
if(kernelSource != NULL)
free(kernelSource);
if(memObj != NULL)
clReleaseMemObject(memObj);
if(kernel != NULL)
clReleaseKernel(kernel);
if(program != NULL)
clReleaseProgram(program);
if(command_queue != NULL)
clReleaseCommandQueue(command_queue);
if(context != NULL)
clReleaseContext(context);
以下是OpenCL内核源代码：
__kernel void test(__global int *pInOut)
int index = get_global_id(0);
pInOut[index] += pInOut[index];
另外，主机端代码部分中，OpenCL源文件路径是写死的。各位朋友可以根据自己环境来重新指定路径。
当然，我们还可以修改主机端&clCreateBuffer(context, CL_MEM_READ_WRITE | CL_MEM_USE_HOST_PTR, contentLength, pHostBuffer, &ret);&这段创建存储器对象的属性。比如，将CL_MEM_USE_HOST_PTR去掉。然后可以再试试效果。
倘若clCreateBuffer的flags参数用的是CL_MEM_ALLOC_HOST_PTR，那么其host_ptr参数必须为空。在调用clEnqueueMapBuffer之后，可以根据其返回的缓存地址，对存储区域做数据初始化。
CL_MEM_ALLOC_HOST_PTR表示应用程序暗示OpenCL实现从主机端可访问的存储空间给设备端分配存储缓存。这个与CL_MEM_USE_HOST_PTR还是有所区别的。CL_MEM_USE_HOST_PTR是完全从应用端当前的内存池分配存储空间；而CL_MEM_ALLOC_HOST_PTR对于CPU与GPU共享主存的环境下，可以在CPU端留下一个访问GPU端VRAM的入口点。我们通过以下程序来测试当前环境的OpenCL实现（以下代码在调用调用了clEnqueueMapBuffer函数之后做了缓存数据初始化的时间比较）：
long deltaTimes[10];
for(int i = 0; i & 10; i++)
struct timeval tBegin, tE
gettimeofday(&tBegin, NULL);
for(int i = 0; i & 1024 * 1024; i++)
pDeviceBuffer[i] = i + 1;
gettimeofday(&tEnd, NULL);
deltaTimes[i] = 1000000 * (tEnd.tv_sec - tBegin.tv_sec ) + tEnd.tv_usec - tBegin.tv_
long useTime = deltaTimes[0];
for(int i = 1; i & 10; i++)
if(useTime & deltaTimes[i])
useTime = deltaTimes[i];
printf("Device memory time spent: %ldus\n", useTime);
int *pHostBuffer = malloc(contentLength);
for(int i = 0; i & 10; i++)
struct timeval tBegin, tE
gettimeofday(&tBegin, NULL);
for(int i = 0; i & 1024 * 1024; i++)
pHostBuffer[i] = i + 1;
gettimeofday(&tEnd, NULL);
deltaTimes[i] = 1000000 * (tEnd.tv_sec - tBegin.tv_sec ) + tEnd.tv_usec - tBegin.tv_
useTime = deltaTimes[0];
for(int i = 1; i & 10; i++)
if(useTime & deltaTimes[i])
useTime = deltaTimes[i];
printf("Host memory time spent: %ldus\n", useTime);
其中，对gettimeofday的调用需要包含头文件&sys/time.h&。这个函数所返回的时间可以精确到&s（微秒）。
在Intel Core i7 4650U, Intel Graphics 5000环境下，花费时间差不多，都是2.6ms（毫秒）。因此，在内核真正执行的时候为了清空这部分存储空间的Cache，驱动还是要做点工作的。当然，驱动也可为这块内存区域分配Write-Combined类型的存储器，这样主机端对这部分数据的访问不会被Cache，尽管速度会慢很多，但是通过non-temporal Stream方式读写还是会很不错。况且大部分OpenCL应用对同一块内存数据的读写都只有一次，这么做也不会造成Cache污染。
Views(...) Comments()作者：旭东出处： /xudong-bupt/
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。如果觉得还有帮助的话，可以点一下右下角的【推荐】，希望能够持续的为大家带来好的技术文章！想跟我一起进步么？那就【关注】我吧。

求助大神这是什么歌5，在clBuildProgram时，RET的返回值为

我要回帖

更多关于瓷娃娃求助遭推诿的文章

随机推荐

求助大神这是什么歌5，在clBuildProgram时，RET的返回值为

我要回帖

更多关于 瓷娃娃求助遭推诿 的文章

随机推荐

更多关于瓷娃娃求助遭推诿的文章