为什么要反向代理处理图片资源呢?因为在做网站采集的时候,有时候我们并不想吧网站的图片全部下载下来,而是希望可以引用它原本网站上的图片,这样可以我们既可以拿到资源,又可以节约我们的磁盘空间,不过坏处就是被抓取的网站如果挂了,图片无法访问,那同样我们的服务器去访问也就失败了!
location /pic/ {set $hostx ""; set $addrs ""; if ( $uri ~ "^/pic/http./+([^/]+)/(.+)$") { set $hostx $1; set $addrs $2; } #resolver 127.0.0.1; #proxy_pass $hostx/$addrs; #proxy_set_header referer "$hostx";rewrite ^(.*)$ $hostx/$addrs;#/$arg_url;#proxy_pass /$arg_search;}
本来是想用proxy来做的,试了下会发生一个死循环,还不知道为什么无法成功,网上资料也还没找到,要是有同学会的话,希望可以指教一二, 最后我只好用rewrite 来让它去跳转了.
对uri进行了一个处理,pic目录后面的应该跟上完整的图片的http路径,然后rewrite到hosts去。。
还是要用proxy_pass来处理,这样可以加referer,更完美
*10月31日更新*
解决了proxy_pass处理失败的问题,原因是resolver没有指定dns地址,用本地地址报错,所以换成电脑上的dns地址就OK了。不过在处理微信公众号还是下载不下来,我还没弄清楚具体原因。
使用php来做一个下载生成,只需要两行代码即可完成:
<?phpheader('Content-type: image/jpeg');echo file_get_contents(isset($_GET["url"])?$_GET["url"]:'');
?>
本文发布于:2024-01-29 04:37:53,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170647427612750.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |