会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
主页
同类热门书
最新上架
- 会员
高效C/C++调试
《高效C/C++调试》是关于软件调试技术的深度探索,融合了作者的实践智慧。书中不仅指导读者如何使用专业的调试工具,还介绍了如何宏观和微观地分析问题,并**限度地发挥调试器功能。此外,书中还深入解读了调试背后的技术原理,如调试符号、内存管理及系统内核对内存的操作机制,以揭示内存管理的关键性和复杂性。除了介绍基础概念外,本书还涵盖了许多增强调试能力的工具与插件。尽管焦点集中在C/C++,但其中的策略与计算机16.3万字 - 会员
Python服务端测试开发实战
本书围绕Python技术栈,讲解测试开发技术栈领域的各项核心技术要点。全书共11章,首先讲解pytest单元测试框架在测试领域的技术栈要点,包含pytest从最基本的应用到高阶应用。接着讲解服务端测试开发领域主流的核心思想、主流测试开发工具在解决服务端测试开发中的技术难点,以及服务端测试框架的设计和项目实战案例。在框架的基础上扩展了服务端测试开发领域的知识面,主要介绍Docker容器化技术、基于D计算机7.8万字 - 会员
智能优化算法与MATLAB编程实践
《智能优化算法与MATLAB编程实践》介绍了国内外新研发的10种智能优化算法,对每种算法的灵感来源、实现过程、函数编程、案例应用都进行了细致描述并给出详细的MATLAB代码,使读者快速掌握智能优化算法的学习和应用方法。全书共分为12章,前10章分别介绍10种智能优化算法的原理、MATLAB实现、具体函数寻优求解过程和应用案例;第11章列举了23种衡量智能优化算法性能的常见测试函数,并给出MATLA计算机6.1万字 - 会员
整理优先:小改进,大回报,整洁代码设计指南
本书分为三部分:第1部分介绍代码的整理(微型重构);第二部分讨论如何将整理工作整合到开发工作流程中;第三部分深入探讨什么是软件设计、软件设计如何驱动软件开发和运营成本以及软件开发和运营成本又如何驱动软件设计、投资软件结构与不投资软件结构之间的权衡是什么、我们可以利用哪些经济和人文原则来决定是否以及如何改变软件结构。计算机3.7万字 - 会员
32位汇编语言程序设计(第3版)
本书以Intel80x86处理器和个人计算机为硬件平台,基于Windows操作系统软件平台,借助MASM和NASM汇编程序讲解32位汇编语言程序设计。本书内容包括基本的汇编语言基础、常用处理器指令和汇编语言伪指令以及基本程序结构,还包括扩展的Windows和DOS编程、与C++语言的混合编程、输入/输出指令及编程,并涉及浮点、多媒体及64位指令等。本书可以作为普通高校“汇编语言程序设计”等课程的计算机21.3万字 - 会员
Python网络爬虫与数据分析从入门到实践
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理计算机9.2万字 - 会员
大模型RAG实战:RAG原理、应用与系统构建
这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参计算机8.4万字 - 会员
C语言从入门到精通(第6版)
《C语言从入门到精通(第6版)》从初学者的角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用C语言进行程序开发需要掌握的各方面知识。全书分为4篇,共20章,内容包括C语言概述、算法、数据类型、运算符与表达式、数据输入/输出、选择结构、循环控制、数组、函数、指针、结构体和共用体、位运算、预处理、文件、内存管理、网络套接字编程、单词背记闯关游戏、学生信息管理系统、单片机基础和GSM短信控制家庭计算机18.5万字 - 会员
Python科学与工程数据分析实战
本书以Python3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用计算机10.1万字
同类书籍最近更新
- 会员
Go语言Hyperledger区块链开发实战
Go语言是近年来非常流行的新兴编程语言,它不仅是以太坊客户端和HyperledgerFabric区块链平台的开发语言,而且广泛应用于区块链应用的开发。本书介绍使用Go语言开发的经典联盟链项目HyperledgerFabric,它由Linux基金会管理。国外的微软、摩根大通、世界银行和国内的华为、阿里巴巴、百度、腾讯等企业都参与了Hyperledger社区的建设。本书涵盖Hyperledger程序设计15.3万字 - 会员
C语言程序设计案例式教程(第2版)
本书在《C语言程序设计案例式教程》的基础上进行了完善、补充和修订,内容更加丰富、翔实,结构层次更加清晰、合理。本书共11章,第1章主要介绍C语言概述、C语言开发环境的搭建和C语言程序的编译机制等;第2章和第3章主要介绍C语言的基础知识,包括关键字、标识符、常量、变量、数据类型、类型转换、运算符与表达式等;第4~9章主要介绍C语言的核心知识,包括结构化程序设计、数组、函数、指针、字符串、结构体等;第程序设计16.3万字 - 会员
数据库管理与开发项目教程:MySQL(微课版·第4版)
本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育程序设计12.6万字