c#打开浏览器并全屏（设置ie浏览器打开全屏）

小多多 • 2022年1月25日上午1:49 • 投稿

基于C#.NET+Phantomjs+Sellenium的高级网络爬虫程序。可执行javascript代码、触发各类事件、操纵页面Dom结构、甚至可以移除不喜欢的css样式。

很多网站都用Ajax动态加载、翻页，比如携程网的评论数据。如果是用之前那个简单的爬虫，是很难直接抓取到所有评论数据的，我们需要去分析那漫天的Javascript代码寻找API数据接口，还要时刻提防对方增加数据陷阱或修改API接口地。

如果通过高级爬虫，就可以完全无视这些问题，无论他们如何加密Javascript代码来隐藏API接口，最终的数据都必要呈现在网站页面上的Dom结构中，不然普通用户也就没法看到了。所以我们可以完全不分析API数据接口，直接从Dom中提取数据，甚至都不需要写那复杂的正则表达式。

主要特性

支持Ajax请求事件的触发及捕获；
支持异步并发抓取；
支持自动事件通知；
支持代理切换;
支持操作Cookies；

运行截图

抓取酒店数据

抓取评论数据

示例代码

 /// <summary>
    /// 抓取酒店评论
    /// </summary>
	static void Main(string[] args)
    {
        var hotelUrl = "http://hotels.ctrip.com/hotel/434938.html";
        var hotelCrawler = new StrongCrawler();
        hotelCrawler.OnStart += (s, e) =>
        {
            Console.WriteLine("爬虫开始抓取地址：" + e.Uri.ToString());
        };
        hotelCrawler.OnError += (s, e) =>
        {
            Console.WriteLine("爬虫抓取出现错误：" + e.Uri.ToString() + "，异常消息：" + e.Exception.ToString());
        };
        hotelCrawler.OnCompleted += (s, e) =>
        {
            HotelCrawler(e);
        };
        var operation = new Operation
        {
            Action = (x) => {
                //通过Selenium驱动点击页面的“酒店评论”
                x.FindElement(By.XPath("//*[@id='commentTab']")).Click();
            },
            Condition = (x) => {
                //判断Ajax评论内容是否已经加载成功
                return x.FindElement(By.XPath("//*[@id='commentList']")).Displayed && x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Displayed && !x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Text.Contains("点评载入中");
            },
            Timeout = 5000
        };

        hotelCrawler.Start(new Uri(hotelUrl), null, operation);//不操作JS先将参数设置为NULL

        Console.ReadKey();
    }

github：https://github.com/microfisher/Strong-Web-Crawler

小多多创始人

0 0

茅台五粮液哪个档次高(茅台和五粮液的区别)

对于喜欢武侠小说的人们，印象最深刻的就是“华山论剑”，这高手与高手之间的对决，往往比的是内功。看似丝毫未动，其实已经对决了上百招，而且招招见血，招招打在要害上。如果把白酒看作一场纷…

小多多
2021年11月20日 • 投稿
如何在微信上开店，微信开店流程图解

最近，微信推出了新的官方开店工具——微信小商店，可一键生成卖货小程序，降低商家进入小程序生态经营和卖货的门槛。随着“0元开店”、“免服务费”、“直播带货”等产品特点的公布，商家们…

励志的mo
投稿 2022年3月7日
杂谈

新能源上市龙头公司有哪些，新能源概念股

bt狗网为您整理的2022年新能源上市龙头公司，供大家参考。 1、隆基股份（601012）：新能源龙头股。截至发稿，隆基股份（601012）涨0.57%，报72.6元，成交额36.…

海淘直接
2022年6月22日
宁波最有名的烧烤店（宁波最好吃的烧烤摊）

如果让你说一说宁波的烧烤，我想你一定不知从何说起，因为这里的烧烤店实在太多了，并且每一家都非常好吃，今天我们就用具体的数据来说一说宁波的烧烤店，看一看凝碧受欢迎的十大烧烤店是哪几家…

小多多
2022年1月25日 • 投稿
杂谈

教你做数据统计与分析(数据透视表空白不显示数据)

表格做好后，可以利用透视表获得我们需要的各种汇总及分析结果，这样很是方便。但有时无论如何操作，数据透视表的操作界面就是不出现。这是因为表格制作不符合透视表的要求造成的。因此，知…

小多多
2021年12月13日
投稿

豆豆钱贷款靠谱吗？豆豆钱是正规公司吗

6月2日，豆豆钱的退款分两笔入账了736及100元，分别对应8400的账单及4500的账单。其中8400被收取了799风险评估费，月还935.2，12期，IRR利率78.84%，…

xswh
2022年3月31日
投稿

高考补录（2020年高考补录学校有哪些）

高考补录（2020年高考补录学校有哪些）同学们最关心！最关心！今年本科有补录么？补录降分？补录有哪些大学？择校菌给你解答这些问题最重要！补录时间来袭！根据广东省教育院公…

xswh
2022年3月31日
人口密度最大的城市（人口最多的城市）

可持续发展一直是人类一直以来在努力的，地球上有太多资源是不可再生的，需要我们从现在开始重视并保护起来，我们都知道是人口第一大国，其次，分别是印度、美国、印度尼西亚、巴西等国家，但人…

季候
2022年4月8日 • 杂谈
五天帝分别是谁（五方天帝人物分析）

中国神话传说里的上古五方天帝及属神，就是指东方天帝太昊伏羲，属神勾芒；南方天帝炎帝神农，属神祝融；西方天帝少昊金天，属神蓐收；北方天帝颛顼高阳，属神玄冥；中央天帝黄帝轩辕，属神后土…

不气馁9
2022年3月7日 • 投稿
2021最新好玩手机游戏(fps单机手游大作)

在海量的单机游戏中，FPS射击游戏种类相当受欢迎，而且这样的作品有着令人沉浸的第一人称视角，最重要的有好多枪械可以体验，还有出色的游戏机制，以及顺手的操作性的体验，那本期就为大家盘…

小多多
2022年1月26日 • 投稿
快手可以赚钱吗（短视频第一股要来了）

短视频第一股要来了。 11月5日快手正式向香港联交所递交招股申请，开启上市征程。无独有偶，短视频领域独角兽抖音也在蠢蠢欲动。据彭博社报道，字节跳动正与包括红杉在内的投资者商讨20…

迅捷
2022年4月9日 • 投稿
基金清盘是不是赔惨了（基金清盘一般亏多少） –

感谢邀请！事实上，基金清盘并不代表大家的钱会没了。首先，要明白清盘的概念—— 清盘是一种法律程序，公司停止运营，所有资产（包括办公室及物业）在短期内出售，变回现金，按先后次序偿还…

时间不会说谎　　
投稿 2022年3月9日
做什么网站最赚钱（盘点5种能赚钱的网站）

现在创业，尤其是互联网创业，很多人都喜欢往公众号上扎堆。而之前互联网创业的大热门——网站却被冷落了不少。说起网站，一些人就会说，现在做网站赚不了多少钱了，建站又麻烦，还需要投资买…

有多难就有多勇敢　　
2022年3月7日 • 投稿
朱云来： 2020年中国经济占全球比重18%，制造业做了突出贡献

3月27日，“2021中国实体经济论坛”在佛山召开。本届论坛由主旨演讲、调研报告发布、全体大会三个部分组成，以“产业链供应链现代化与制造业高质量发展”为主题，探究在后疫情时代与“双…

小多多
2022年1月25日 • 投稿
有什么办法可以时实监控别人的微信聊天记录吗

[ 扬帆导读 ] 怎样查别人的微信聊天记录不让发现？微信是一款通讯服务社交软件，功能设备都很多。如何查看对方微信的聊天记录 lakarc团队实力经过128项安全检验，计算机领域…

吉米
投稿 2022年3月24日

发表回复

登录后才能评论

c#打开浏览器并全屏（设置ie浏览器打开全屏）

主要特性

运行截图

示例代码

相关推荐

发表回复