本文共 16298 字,大约阅读时间需要 54 分钟。
五、libcurl使用的HTTP消息头
当使用libcurl发送http请求时,它会自动添加一些http头。我们可以通过CURLOPT_HTTPHEADER属性手动替换、添加或删除相应 的HTTP消息头。 Host http1.1(大部分http1.0)版本都要求客户端请求提供这个信息头。 Pragma “no-cache”。表示不要缓冲数据。 Accept “*/*”。表示允许接收任何类型的数据。 Expect 以POST的方式向HTTP服务器提交请求时,libcurl会设置该消息头为”100-continue”,它要求服务器在正式处理该请求之前,返回一 个”OK”消息。如果POST的数据很小,libcurl可能不会设置该消息头。 自定义选项 当前越来越多的协议都构建在HTTP协议之上(如:soap),这主要归功于HTTP的可靠性,以及被广泛使用的代理支持(可以穿透大部分防火墙)。 这些协议的使用方式与传统HTTP可能有很大的不同。对此,libcurl作了很好的支持。 自定义请求方式(CustomRequest) HTTP支持GET, HEAD或者POST提交请求。可以设置CURLOPT_CUSTOMREQUEST来设置自定义的请求方式,libcurl默认以GET方式提交请求: curl_easy_setopt(easy_handle, CURLOPT_CUSTOMREQUEST, “MYOWNREQUEST”);修改消息头
HTTP协议提供了消息头,请求消息头用于告诉服务器如何处理请求;响应消息头则告诉浏览器如何处理接收到的数据。在libcurl中,你可以自由的添加 这些消息头:对于已经存在的消息头,可以重新设置它的值:
删除消息头
对于一个已经存在的消息头,设置它的内容为空,libcurl在发送请求时就不会同时提交该消息头:
六、多线程问题
首先一个基本原则就是:绝对不应该在线程之间共享同一个libcurl handle(CURL *对象),不管是easy handle还是multi handle(本文只介绍easy_handle)。一个线程每次只能使用一个handle。 libcurl是线程安全的,但有两点例外:信号(signals)和SSL/TLS handler。 信号用于超时失效名字解析(timing out name resolves)。libcurl依赖其他的库来支持SSL/STL,所以用多线程的方式访问HTTPS或FTPS的URL时,应该满足这些库对多线程 操作的一些要求。详细可以参考: OpenSSL:GnuTLS:
NSS: 宣称是多线程安全的。
七、什么时候libcurl无法正常工作
传输失败总是有原因的。你可能错误的设置了一些libcurl的属性或者没有正确的理解某些属性的含义,或者是远程主机返回一些无法被正确解析的内容。 这里有一个黄金法则来处理这些问题:将CURLOPT_VERBOSE属性设置为1,libcurl会输出通信过程中的一些细节。如果使用的是http协 议,请求头/响应头也会被输出。将CURLOPT_HEADER设为1,这些头信息将出现在消息的内容中。 当然不可否认的是,libcurl还存在bug。 如果你对相关的协议了解越多,在使用libcurl时,就越不容易犯错。八、关于密码
客户端向服务器发送请求时,许多协议都要求提供用户名与密码。libcurl提供了多种方式来设置它们。 一些协议支持在URL中直接指定用户名和密码,类似于: protocol://user:password@example.com/path/。libcurl能正确的识别这种URL中的用户名与密码并执行 相应的操作。如果你提供的用户名和密码中有特殊字符,首先应该对其进行URL编码。 也可以通过CURLOPT_USERPWD属性来设置用户名与密码。参数是格式如 “user:password ”的字符串: curl_easy_setopt(easy_handle, CURLOPT_USERPWD, “user_name:password”); 有时候在访问代理服务器的时候,可能时时要求提供用户名和密码进行用户身份验证。这种情况下,libcurl提供了另 一个属性CURLOPT_PROXYUSERPWD: curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD, “user_name:password”); 在UNIX平台下,访问FTP的用户名和密码可能会被保存在$HOME/.netrc文件中。libcurl支持直接从这个文件中获取用户名与密码: curl_easy_setopt(easy_handle, CURLOPT_NETRC, 1L); 在使用SSL时,可能需要提供一个私钥用于数据安全传输,通过CURLOPT_KEYPASSWD来设置私钥: curl_easy_setopt(easy_handle, CURLOPT_KEYPASSWD, “keypassword”);九、HTTP验证
在使用HTTP协议时,客户端有很多种方式向服务器提供验证信息。默认的 HTTP验证方法是”Basic”,它将用户名与密码以明文的方式、经Base64编码后保存在HTTP请求头中,发往服务器。当然这不太安全。 当前版本的libcurl支持的验证方法有:basic, Digest, NTLM, Negotiate, GSS-Negotiate and SPNEGO。(译者感叹:搞Web这么多年,尽然不知道这些Http的验证方式,实在惭愧。)可以通过CURLOPT_HTTPAUTH属性来设置具体 的验证方式: curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH, CURLAUTH_DIGEST); 向代理服务器发送验证信息时,可以通过CURLOPT_PROXYAUTH设置验证方式: curl_easy_setopt(easy_handle, CURLOPT_PROXYAUTH, CURLAUTH_NTLM); 也可以同时设置多种验证方式(通过按位与), 使用‘CURLAUTH_ANY‘将允许libcurl可以选择任何它所支持的验证方式。通过CURLOPT_HTTPAUTH或 CURLOPT_PROXYAUTH属性设置的多种验证方式,libcurl会在运行时选择一种它认为是最好的方式与服务器通信: curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH, CURLAUTH_DIGEST|CURLAUTH_BASIC); // curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
curl_slist_free_all(headers);
curl_easy_cleanup(curl); } fclose(fp); return true; } } bool postUrl(char *filename) { CURL *curl; CURLcode res; FILE *fp; if ((fp = fopen(filename, “w“)) == NULL) return false; curl = curl_easy_init(); if (curl) { curl_easy_setopt(curl, CURLOPT_COOKIEFILE, “/tmp/cookie.txt“); // 指定cookie文件 curl_easy_setopt(curl, CURLOPT_POSTFIELDS, “&logintype=uid&u=xieyan&psw=xxx86“); // 指定post内容 //curl_easy_setopt(curl, CURLOPT_PROXY, “10.99.60.201:8080″); curl_easy_setopt(curl, CURLOPT_URL, “ http://mail.sina.com.cn/cgi-bin/login.cgi “); // 指定url curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); res = curl_easy_perform(curl); curl_easy_cleanup(curl); } fclose(fp); return true; } int main(void) { getUrl(“/tmp/get.html“); postUrl(“/tmp/post.html“); }编译gcc get_post.c -o get_post –lcurl
./ get_post
2 获取html网页
curl = curl_easy_init(); //初始化一个CURL类型的指针
if(curl!=NULL) { //设置curl选项. 其中CURLOPT_URL是让用户指 定url. argv[1]中存放的命令行传进来的网址 curl_easy_setopt(curl, CURLOPT_URL, argv[1]); //调用curl_easy_perform 执行我们的设置.并进行相关的操作. 在这 里只在屏幕上显示出来. res = curl_easy_perform(curl); //清除curl操作. curl_easy_cleanup(curl); } return 0; }编译gcc get_http.c -o get_http –lcurl
./ get_http
#include <curl/curl.h>;
#include <curl/types.h>; #include <curl/easy.h>;FILE *fp; //定义FILE类型指针
//这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的 //完成数据保存功能 size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream) { int written = fwrite(ptr, size, nmemb, (FILE *)fp); return written; }int main(int argc, char *argv[])
{ CURL *curl;curl_global_init(CURL_GLOBAL_ALL);
curl=curl_easy_init(); curl_easy_setopt(curl, CURLOPT_URL, argv[1]);if((fp=fopen(argv[2],“w“))==NULL)
{ curl_easy_cleanup(curl); exit(1); } CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理 curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data); curl_easy_perform(curl); curl_easy_cleanup(curl); exit(0); }编译gcc save_http.c -o save_http –lcurl
./ save_http /tmp/baidu
GtkWidget *Bar;
这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的 //完成数据保存功能 size_t my_write_func(void *ptr, size_t size, size_t nmemb, FILE *stream) { return fwrite(ptr, size, nmemb, stream); } //这个函数是为了符合CURLOPT_READFUNCTION而构造的 //数据上传时使用 size_t my_read_func(void *ptr, size_t size, size_t nmemb, FILE *stream) { return fread(ptr, size, nmemb, stream); } //这个函数是为了符合CURLOPT_PROGRESSFUNCTION而构造的 //显示文件传输进度,t代表文件大小,d代表传 输已经完成部分 int my_progress_func(GtkWidget *bar, double t, /* dltotal */ double d, /* dlnow */ double ultotal, double ulnow) { /* printf(“%d / %d (%g %%)n”, d, t, d*100.0/t);*/ gdk_threads_enter(); gtk_progress_set_value(GTK_PROGRESS(bar), d*100.0/t); gdk_threads_leave(); return 0; }void *my_thread(void *ptr)
{ CURL *curl; CURLcode res; FILE *outfile; gchar *url = ptr;curl = curl_easy_init();
if(curl) { outfile = fopen(“test.curl“, “w“);curl_easy_setopt(curl, CURLOPT_URL, url);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, outfile); curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_write_func); curl_easy_setopt(curl, CURLOPT_READFUNCTION, my_read_func); curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L); curl_easy_setopt(curl, CURLOPT_PROGRESSFUNCTION, my_progress_func); curl_easy_setopt(curl, CURLOPT_PROGRESSDATA, Bar);res = curl_easy_perform(curl);
fclose(outfile);
/* always cleanup */ curl_easy_cleanup(curl); }return NULL;
}int main(int argc, char **argv)
{ GtkWidget *Window, *Frame, *Frame2; GtkAdjustment *adj;/* Must initialize libcurl before any threads are started */
curl_global_init(CURL_GLOBAL_ALL);/* Init thread */
g_thread_init(NULL);gtk_init(&argc, &argv);
Window = gtk_window_new(GTK_WINDOW_TOPLEVEL); Frame = gtk_frame_new(NULL); gtk_frame_set_shadow_type(GTK_FRAME(Frame), GTK_SHADOW_OUT); gtk_container_add(GTK_CONTAINER(Window), Frame); Frame2 = gtk_frame_new(NULL); gtk_frame_set_shadow_type(GTK_FRAME(Frame2), GTK_SHADOW_IN); gtk_container_add(GTK_CONTAINER(Frame), Frame2); gtk_container_set_border_width(GTK_CONTAINER(Frame2), 5); adj = (GtkAdjustment*)gtk_adjustment_new(0, 0, 100, 0, 0, 0); Bar = gtk_progress_bar_new_with_adjustment(adj); gtk_container_add(GTK_CONTAINER(Frame2), Bar); gtk_widget_show_all(Window);if (!g_thread_create(&my_thread, argv[1], FALSE, NULL) != 0)
g_warning(“can’t create the thread“);gdk_threads_enter();
gtk_main(); gdk_threads_leave(); return 0; }编译export PKG_CONFIG_PATH=/usr/lib/pkgconfig/
gcc progress.c –o progress ` pkg-config –libs –cflags gtk+-2..0` -lcurl –lgthread-2.0 ./ progress5 断点续传实例
#include <curl/curl.h>
//这个函数为CURLOPT_HEADERFUNCTION参数构造 /* 从http头部获取文件size*/ size_t getcontentlengthfunc(void *ptr, size_t size, size_t nmemb, void *stream) { int r; long len = 0;/* _snscanf() is Win32 specific */
// r = _snscanf(ptr, size * nmemb, “Content-Length: %ldn”, &len); r = sscanf(ptr, “Content-Length: %ldn“, &len); if (r) /* Microsoft: we don’t read the specs */ *((long *) stream) = len;return size * nmemb;
}/* 保存下载文件 */
size_t wirtefunc(void *ptr, size_t size, size_t nmemb, void *stream) { return fwrite(ptr, size, nmemb, stream); }/*读取上传文件 */
size_t readfunc(void *ptr, size_t size, size_t nmemb, void *stream) { FILE *f = stream; size_t n;if (ferror(f))
return CURL_READFUNC_ABORT;n = fread(ptr, size, nmemb, f) * size;
return n;
}// 下载 或者上传文件函数
int download(CURL *curlhandle, const char * remotepath, const char * localpath, long timeout, long tries) { FILE *f; curl_off_t local_file_len = –1 ; long filesize =0 ;CURLcode r = CURLE_GOT_NOTHING;
int c; struct stat file_info; int use_resume = 0; /* 得到本地文件大小 */ //if(access(localpath,F_OK) ==0)if(stat(localpath, &file_info) == 0)
{ local_file_len = file_info.st_size; use_resume = 1; } //采用追加方式打开文件,便于实现文件断点续传工作 f = fopen(localpath, “ab+“); if (f == NULL) { perror(NULL); return 0; }//curl_easy_setopt(curlhandle, CURLOPT_UPLOAD, 1L);
curl_easy_setopt(curlhandle, CURLOPT_URL, remotepath);curl_easy_setopt(curlhandle, CURLOPT_CONNECTTIMEOUT, timeout); // 设置连接超时,单位秒
//设置http 头部处理函数 curl_easy_setopt(curlhandle, CURLOPT_HEADERFUNCTION, getcontentlengthfunc); curl_easy_setopt(curlhandle, CURLOPT_HEADERDATA, &filesize); // 设置文件续传的位置给libcurl curl_easy_setopt(curlhandle, CURLOPT_RESUME_FROM_LARGE, use_resume?local_file_len:0);curl_easy_setopt(curlhandle, CURLOPT_WRITEDATA, f);
curl_easy_setopt(curlhandle, CURLOPT_WRITEFUNCTION, wirtefunc);//curl_easy_setopt(curlhandle, CURLOPT_READFUNCTION, readfunc);
//curl_easy_setopt(curlhandle, CURLOPT_READDATA, f); curl_easy_setopt(curlhandle, CURLOPT_NOPROGRESS, 1L); curl_easy_setopt(curlhandle, CURLOPT_VERBOSE, 1L);r = curl_easy_perform(curlhandle);
fclose(f);
if (r == CURLE_OK)
return 1; else { fprintf(stderr, “%sn“, curl_easy_strerror(r)); return 0; } }int main(int c, char **argv) {
CURL *curlhandle = NULL;curl_global_init(CURL_GLOBAL_ALL);
curlhandle = curl_easy_init();//download(curlhandle, “ftp://user:pass@host/path/file”, “C:\file”, 0, 3);
download(curlhandle , “http://software.sky-union.cn/index.asp“,“/work/index.asp“,1,3); curl_easy_cleanup(curlhandle); curl_global_cleanup();return 0;
}编译gcc resume.c -o resume –lcurl
./ resume