博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
CURL与PHP-CLI的应用【CURL篇】
阅读量:4952 次
发布时间:2019-06-12

本文共 9930 字,大约阅读时间需要 33 分钟。

curl是一个极为强大的HTTP传输工具,支持文件的上传和下载;

curl在命令行下的使用

命令参数
-a/--append 上传文件时,附加到目标文件-A/--user-agent 
设置用户代理发送给服务器- anyauth 可以使用“任何”身份验证方法-b/--cookie
cookie字符串或文件读取位置- basic 使用HTTP基本验证-B/--use-ascii 使用ASCII /文本传输-c/--cookie-jar
操作结束后把cookie写入到这个文件中-C/--continue-at
断点续转-d/--data
HTTP POST方式传送数据--data-ascii 以ascii的方式post数据--data-binary 以二进制的方式post数据--negotiate 使用HTTP身份验证--digest 使用数字身份验证--disable-eprt 禁止使用EPRT或LPRT--disable-epsv 禁止使用EPSV-D/--dump-header
把header信息写入到该文件中--egd-file
为随机数据(SSL)设置EGD socket路径--tcp-nodelay 使用TCP_NODELAY选项-e/--referer 来源网址-E/--cert
客户端证书文件和密码 (SSL)--cert-type
证书文件类型 (DER/PEM/ENG) (SSL)--key
私钥文件名 (SSL)--key-type
私钥文件类型 (DER/PEM/ENG) (SSL)--pass
私钥密码 (SSL)--engine
加密引擎使用 (SSL). "--engine list" for list--cacert
CA证书 (SSL)--capath
CA目录 (made using c_rehash) to verify peer against (SSL)--ciphers
SSL密码--compressed 要求返回是压缩的形势 (using deflate or gzip)--connect-timeout
设置最大请求时间--create-dirs 建立本地目录的目录层次结构--crlf 上传是把LF转变成CRLF-f/--fail 连接失败时不显示http错误--ftp-create-dirs 如果远程目录不存在,创建远程目录--ftp-method [multicwd/nocwd/singlecwd] 控制CWD的使用--ftp-pasv 使用 PASV/EPSV 代替端口--ftp-skip-pasv-ip 使用PASV的时候,忽略该IP地址--ftp-ssl 尝试用 SSL/TLS 来进行ftp数据传输--ftp-ssl-reqd 要求用 SSL/TLS 来进行ftp数据传输-F/--form
模拟http表单提交数据-form-string
模拟http表单提交数据-g/--globoff 禁用网址序列和范围使用{}和[]-G/--get 以get的方式来发送数据-h/--help 帮助-H/--header
自定义头信息传递给服务器--ignore-content-length 忽略的HTTP头信息的长度-i/--include 输出时包括protocol头信息-I/--head 只显示文档信息从文件中读取-j/--junk-session-cookies忽略会话Cookie- 界面
指定网络接口/地址使用- krb4
<级别>
启用与指定的安全级别krb4-j/--junk-session-cookies 读取文件进忽略session cookie--interface
使用指定网络接口/地址--krb4
使用指定安全级别的krb4-k/--insecure 允许不使用证书到SSL站点-K/--config 指定的配置文件读取-l/--list-only 列出ftp目录下的文件名称--limit-rate
设置传输速度--local-port
强制使用本地端口号-m/--max-time
设置最大传输时间--max-redirs
设置最大读取的目录数--max-filesize
设置最大下载的文件总量-M/--manual 显示全手动-n/--netrc 从netrc文件中读取用户名和密码--netrc-optional 使用 .netrc 或者 URL来覆盖-n--ntlm 使用 HTTP NTLM 身份验证-N/--no-buffer 禁用缓冲输出-o/--output 把输出写到该文件中-O/--remote-name 把输出写到该文件中,保留远程文件的文件名-p/--proxytunnel 使用HTTP代理--proxy-anyauth 选择任一代理身份验证方法--proxy-basic 在代理上使用基本身份验证--proxy-digest 在代理上使用数字身份验证--proxy-ntlm 在代理上使用ntlm身份验证-P/--ftp-port
使用端口地址,而不是使用PASV-Q/--quote
文件传输前,发送命令到服务器-r/--range
检索来自HTTP/1.1或FTP服务器字节范围--range-file 读取(SSL)的随机文件-R/--remote-time 在本地生成文件时,保留远程文件时间--retry
传输出现问题时,重试的次数--retry-delay
传输出现问题时,设置重试间隔时间--retry-max-time
传输出现问题时,设置最大重试时间-s/--silent静音模式。不输出任何东西-S/--show-error 显示错误--socks4
用socks4代理给定主机和端口--socks5
用socks5代理给定主机和端口--stderr
-t/--telnet-option
Telnet选项设置--trace
对指定文件进行debug--trace-ascii
Like --跟踪但没有hex输出--trace-time 跟踪/详细输出时,添加时间戳-T/--upload-file
上传文件--url
Spet URL to work with-u/--user
设置服务器的用户和密码-U/--proxy-user
设置代理用户名和密码-v/--verbose-V/--version 显示版本信息-w/--write-out [format]什么输出完成后-x/--proxy
在给定的端口上使用HTTP代理-X/--request
指定什么命令-y/--speed-time 放弃限速所要的时间。默认为30-Y/--speed-limit 停止传输速度的限制,速度时间'秒'-z/--time-cond 传送时间设置-0/--http1.0 使用HTTP 1.0-1/--tlsv1 使用TLSv1(SSL)-2/--sslv2 使用SSLv2的(SSL)-3/--sslv3 使用的SSLv3(SSL)--3p-quote like -Q for the source URL for 3rd party transfer--3p-url 使用url,进行第三方传送--3p-user 使用用户名和密码,进行第三方传送-4/--ipv4 使用IP4-6/--ipv6 使用IP6-#/--progress-bar 用进度条显示当前的传送状态
实例

抓取页面内容到一个文件中

curl -o home.html  http://www.pinlehuo.com $ -o/--output 把输出写到该文件中# 或者 ↓↓$ curl http://www.linuxidc.com > page.html

抓具体的文件,用-O(大写的),后面的url要具体到某个文件,不然抓不下来。我们还可以用正则来抓取东西,但文件名还是得具体

$ curl -O www.pinlehuo.com/d/file/admin/2015/05/5551bf06428ec.jpg$ curl -O http://www.codesky.net/wp-content/uploads/2010/[0-9][0-9]/aaaaa.jpg

模拟表单信息,模拟登录,保存cookie信息

# -D/--dump-header 
把header信息写入到该文件中$ curl -c ./cookie_c.txt -F log=aaaa -F pwd=****** http://www.codesky.net/wp-login.php (没试过~)

查看响应头信息

curl -I http://www.sunrisecorp.net/

模拟表单信息,模拟登录,保存头信息

curl -D ./cookie_D.txt -F log=aaaa -F pwd=****** http://www.codesky.net/wp-login.php# -c(小写)产生的cookie和-D里面的cookie是不一样的。

使用cookie文件

curl -b ./cookie_c.txt  http://www.codesky.net/wp-admin

断点续传,-C(大写的)

curl -C -O http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg

传送数据,最好用登录页面测试,因为你传值过去后,curl回抓数据,你可以看到你传值有没有成功

curl -d log=aaaa  http://www.codesky.net/wp-login.php

伪造来源地址,有的网站会判断,请求来源地址

curl -e http://localhost http://www.codesky.net/wp-login.php

当我们经常用curl去搞人家东西的时候,人家会把你的IP给屏蔽掉的,这个时候,我们可以用代理

curl -x 24.10.28.84:32779 -o home.html http://www.codesky.net

比较大的东西,我们可以分段下载

[root@krlcgcms01 mytest]# curl -r 0-100 -o img.part1 http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current Dload  Upload   Total   Spent    Left  Speed100   101  100   101    0     0    105      0 --:--:-- --:--:-- --:--:--     0[root@krlcgcms01 mytest]# curl -r 100-200 -o img.part2 http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current Dload  Upload   Total   Spent    Left  Speed100   101  100   101    0     0     57      0  0:00:01  0:00:01 --:--:--     0[root@krlcgcms01 mytest]# curl -r 200- -o img.part3 http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current Dload  Upload   Total   Spent    Left  Speed100  104k  100  104k    0     0  52793      0  0:00:02  0:00:02 --:--:-- 88961[root@krlcgcms01 mytest]# ls |grep part | xargs du -sh4.0K    one.part1112K    three.part34.0K    two.part2用的时候,把他们cat一下就OK了,cat img.part* >img.jpg

显示下载进度信息

[root@krlcgcms01 mytest]# curl -# -O  http://www.codesky.net/wp-content/uploads/2010/09/compare_varnish.jpg######################################################################## 100.0%

通过ftp下载文件

[zhangy@BlackGhost ~]$ curl -u 用户名:密码 -O http://www.codesky.net/demo/curtain/bbstudy_files/style.css % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current Dload  Upload   Total   Spent    Left  Speed101  1934  101  1934    0     0   3184      0 --:--:-- --:--:-- --:--:--  7136或者用下面的方式[zhangy@BlackGhost ~]$ curl -O ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/style.css

通过ftp上传

[zhangy@BlackGhost ~]$ curl -T test.sql ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/

curl在PHP脚本下的使用

安装cURL库

WAMP环境

分别打开以下 2 个文件:
wamp\bin\php(your php version)\php.ini
wamp\bin\Apache(your apache version)\bin\php.ini
搜索 extension=php_curl.dll ,然后删除前面的符号 ;
重启WAMP 即可。
//↑↑先按照以上的操作,如果不行,再参考以下两个;
注:如果是64位的系统,还需要访问 http://www.anindya.com/ 下载对应版本的64位php压缩包,解压后,将 ext 目录下 的 php_curl.dll 覆盖 wamp php对应版本 wamp\bin\php\php5.4.12\ext 目录下的 php_curl.dll 文件,然后重启WAMP
参考网站:http://blog.csdn.net/ewili/article/details/9008493

window

1.php.ini把前面的extension=php_curl.dll分号去掉;
2.php_curl.dll,libeay32.dll,ssleay32.dll 复制到 %windir%/system32下

linux

如果php已经在系统编译好,后来又需要添加新的扩展。一种方式就是重新完全编译php,另一种方式就是单独编译扩展库,以extension的形式扩展。下面以安装curl扩展为例:
./configure
make
php要求curl的目录要有include和lib目录,并且include下要有easy.h 和curl.h两个文件,lib下要有libcurl.a。经编译后include下的文件有了,但是lib目录下没有。原来生成到lib/.libs目录下,所以要copy到lib目录

2、进入安装原php的源码目录,

cd ext
cd curl
phpize
./configure --with-curl=DIR
make
就会在PHPDIR/ext/curl/moudles/下生成curl.so的文件。

PHP中的CURL函数库
curl_close — 关闭一个curl会话curl_copy_handle — 拷贝一个curl连接资源的所有内容和参数curl_errno — 返回一个包含当前会话错误信息的数字编号curl_error — 返回一个包含当前会话错误信息的字符串curl_exec — 执行一个curl会话curl_getinfo — 获取一个curl连接资源句柄的信息curl_init — 初始化一个curl会话curl_multi_add_handle — 向curl批处理会话中添加单独的curl句柄资源curl_multi_close — 关闭一个批处理句柄资源curl_multi_exec — 解析一个curl批处理句柄curl_multi_getcontent — 返回获取的输出的文本流curl_multi_info_read — 获取当前解析的curl的相关传输信息curl_multi_init — 初始化一个curl批处理句柄资源curl_multi_remove_handle — 移除curl批处理句柄资源中的某个句柄资源curl_multi_select — Get all the sockets associated with the cURL extension, which can then be "selected"curl_setopt_array — 以数组的形式为一个curl设置会话参数curl_setopt — 为一个curl设置会话参数参考网址:http://blog.csdn.net/superbirds/article/details/7532277: curl_setopt 会话参数详解参考网址:http://www.zhibotie.net/space-1-do-blog-id-71.htmlcurl_version — 获取curl相关的版本信息curl_init()函数的作用初始化一个curl会话,curl_init()函数唯一的一个参数是可选的,表示一个url地址。curl_exec()函数的作用是执行一个curl会话,唯一的参数是curl_init()函数返回的句柄。curl_close()函数的作用是关闭一个curl会话,唯一的参数是curl_init()函数返回的句柄。

普通抓取网页实例

// 1. 初始化$ch = curl_init();//$ch = curl_init("http://www.baidu.com/");// 2. 设置选项,包括URLcurl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/");//CURLOPT_URL: 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//设定是否输出页面内容,这里为0的话,后面就不用echo,就直接把curl抓回来的内容输出;curl_setopt($ch, CURLOPT_HEADER, 0);//设定是否显示头信息,为1的时候,就会把响应头信息也给一并输出// 3. 执行并获取HTML文档内容$output = curl_exec($ch);//echo $output;//输出抓回来的网页;如果curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0),就不需要此句;// 4. 释放curl句柄curl_close($ch);

在抓取的基础上判断错误并输出错误,得到抓取过来的页面的信息

// 1. 初始化$ch = curl_init();//$ch = curl_init("http://www.baidu.com/");// 2. 设置选项,包括URLcurl_setopt($ch, CURLOPT_URL, "http://www.baidu.com");//CURLOPT_URL: 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//设定是否输出页面内容,这里为0的话,后面就不用echo,就直接把curl抓回来的内容输出;curl_setopt($ch, CURLOPT_HEADER, 0);//设定是否显示头信息,为1的时候,就会把响应头信息也给一并输出// 3. 执行并获取HTML文档内容$output = curl_exec($ch);//echo $output;//输出抓回来的网页;如果curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0),就不需要此句;#判断错误并输出错误if($output === false){ //全等,不能==; 是为了和获取为空字符串分开;   echo "cUrl Error:" . curl_error($h); //如果获取失败的话,就输出失败原因;但是在有时候却被工信部重定向到114查询;}#得到抓取过来的页面的信息//$info = curl_getinfo($ch);//print_r($info);//包含了抓取过来的页面的信息/*  “url” //资源网络地址  “content_type” //内容编码  “http_code” //HTTP状态码  “header_size” //header的大小  “request_size” //请求的大小  “filetime” //文件创建时间  “ssl_verify_result” //SSL验证结果  “redirect_count” //跳转技术    “total_time” //总耗时  “namelookup_time” //DNS查询耗时  “connect_time” //等待连接耗时  “pretransfer_time” //传输前准备耗时  “size_upload” //上传数据的大小  “size_download” //下载数据的大小  “speed_download” //下载速度  “speed_upload” //上传速度  “download_content_length”//下载内容的长度  “upload_content_length” //上传内容的长度    “starttransfer_time” //开始传输的时间  “redirect_time”//重定向耗时*///echo '获取'. $info['url'] . '耗时'. $info['total_time'] . '秒';// 4. 释放curl句柄curl_close($ch);

转载于:https://www.cnblogs.com/nixi8/p/4500531.html

你可能感兴趣的文章
appium api 文档
查看>>
pathon连接mysql->AttributeError: 'str' object has no attribute 'decode'
查看>>
Salt-ssh批量部署minion
查看>>
iOS学习笔记 ——Trip to iOS
查看>>
[开发笔记]UIApplication介绍
查看>>
GPIO外部中断
查看>>
ios 第三方qq授权登陆,第一次登陆后,再次登陆,失效
查看>>
扔鸡蛋问题具体解释(Egg Dropping Puzzle)
查看>>
express: command not found.
查看>>
TinyXml高速入门(一)
查看>>
点击表格的单元格时实现变颜色,通过for循环为每个单元格添加一个onclick事件...
查看>>
webform Response的一些成员
查看>>
Countries in War(强连通分量及其缩点)
查看>>
Eclipse中用Link方式安装Maven插件(转载)
查看>>
Android菜鸟的成长笔记(11)——Android中的事件处理
查看>>
JStrom的zk数据
查看>>
使用“dotconnect for oracle”绕过oracle客户端连接Oracle数据库
查看>>
CentOS/RHEL Linux安装EPEL第三方软件源
查看>>
redisson
查看>>
Weblogic集群
查看>>