网页抓取所有文章-最新网页抓取相关文章汇总-第10页-HelloWorld开发者社区

•

4年前

PageRank算法是Google的核心搜索算法，在所有链接型文档搜索中有极大用处，而且在我们的各种关联系统中都有好的用法，比如专家评分系统，微博搜索/排名,SNS系统等。 PageRank算法的依据或思想： 1，被重要的网页链接的越多（外链），此网页就越重要 2，此网页对外的链接越少越重要这两个依据不能

Wesley13

•

4年前

java通过sina端口提取股票历史数据并存入MySQL

1.提取股票代码代码见：http://www.oschina.net/code/snippet\_2688840\_55337(http://www.oschina.net/code/snippet_2688840_55337) 2抓取sina股票的json页面数据；代码见：http://www.oschina.net/code/snip

Wesley13

•

4年前

UIWebView出现的webViewDidFinishLoad一直没触发的问题的解决方案

可能是由于网页上html不合规范的问题，使得第一种方法加载完网页会不调用webViewDidFinishLoad，但用第二种会调用webViewDidFinishLoad第一种：//不调用webViewDidFinishLoadNSURLRequest\req\\NSURLRequestalloc\initWithURL:\N

Stella981

•

4年前

Nginx+uwsgi+ssl配置https

使用原始django，太过于笨重和杂多nginx是一个轻量级的web服务器，在处理静态资源和高并发有优势uwsgi是一个基于python的高效率的协议，处理后端和动态网页有优势所以这里采用静态网页交给nginx解析，动态网页交给uwsgi解析，并且nginx配置ssl，即可以使用出高安全，高效率的部署。步骤我

Stella981

•

4年前

Nginx反爬虫：禁止某些User Agent抓取网站

一、概述网站反爬虫的原因不遵守规范的爬虫会影响网站的正常使用网站上的数据是公司的重要资产爬虫对网站的爬取会造成网站统计数据的污染常见反爬虫手段1\.根据IP访问频率封禁IP2\.设置账号登陆时长，账号访问过多封禁设置账号的登录限制，只有登录才能展现内容

Stella981

•

4年前

JavaScript DOM编程艺术（第2版）学习笔记1（1~4章）

第一章一些基本概念HTML（超文本标记语言），构建网页的静态结构，由一系列的DOM组成；CSS（层叠样式表），给网页各部分结构添加样式；JavaScript，通过获取DOM给静态结构加上动作，使用户能够与静态网页进行交互；DOM，一种API（应用程序接口），通过这个接口动态的访问和修改结构或样式。浏

Stella981

•

4年前

Django的日常

\toc\Django的日常AJAXAJAX简介首先AJAX是一种无需重新加载整个网页的前提下,能够更新部分网页的技术,他并不是一种新的编程语言,而是一种使用现有标准的新方法,是基于原生JavaScript开发的,他可以用于创建快速动态网页.AJAX最大的特点就是局部刷新以及异步提交,局部刷新