Download List

프로젝트 설명

Yioop! is a PHP search engine. Yioop! can be configured as either a general purpose search engine for the whole Web or it can be configured to provide search results for a set of URLs or domains. Yioop can crawl pages or can directly index archives such as ARC and WARC. It supports indexing several file formats such as HTML, Atom, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, and sitemaps. The Yioop! crawler can be deployed on one or many machines. It supports having one or more to crawl scheduler processes, as well as multiple fetchers and mirrors. Crawling respects robots.txt including Crawl-delay. Yioop! crawls are stored in a Web archive format that is easy to move around. Crawling can be done on one machine and the results deployed elsewhere. Yioop! supports mixing of crawls. Yioop! comes with a search front end that can be localized as desired using a GUI. This GUI supports RTL languages. Management of crawls can also be done using this GUI. Yioop! can be configured in a straightforward manner to make use of file caching or memcache if available.

System Requirements

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2013-01-05 11:37
0.92

이 릴리스에서 새로운 인덱스와 쿼리 기반 조합 (크롤링 믹스) 오래 된 검색 인덱스를 구체화 합니다.

이 크롤링 믹스의 쿼리 성능이 훨씬 더 해야 합니다.

검색 결과의 캐시 페이지 당신이, 많은 인터넷 아카이브 하는 방법 처럼 모든 인덱스의 캐시 페이지를 검색할 수 있는 UI의 새로운 역사를 만들었습니다.

Yioop는 이제 검색에 수행 된 후로 로마와 다른 스크립트에 대 한 API는 맞춤법 정정을 지원 합니다.

쿼리 성능이 이전 버전에 비해 향상 되었습니다 및 사소한 버그가 많이 해결 되었습니다.
Tags: Minor
This release supports materializing as new indexes query-based combinations (crawl mixes) of
old search indexes.

This should make query performance of crawl mixes much better.

Cache pages of search results now have a new history UI which allows you to search cache pages
in all indexes you have,
much like the way Internet Archive does.

Yioop now supports spell corrections on searches after they have been performed,
and it has an
API for transliterating between roman and other scripts.

Query performance has been improved over previous versions, and lots of minor bugs have been
fixed.

2012-02-04 11:54
0.82

이 여러 기계 "를 다음 크롤 링" 큐의 일부를 유지 관리 함으로써 확장성이 향상된을 놓습니다. 주어진된 해시의 문서에 대 한 책임을 지지 하는 다른 기계와 기계 사이 쿼리 처리를 분할할 수 있습니다. Yioop! 이제 컴퓨터의 미러링을 지원 합니다. 두 개의 단어 어구 위키백과 URL 덤프와 같은 XML 파일에 의해 결정 된 대로 이제 논리 단위로 처리할 수 있습니다. Yioop! 모델-뷰-컨트롤러 framework 확장을 쉽게 만들어왔다와 그것에 대 한 설명서는 웹사이트에 추가 되었습니다.
Tags: Minor
This release improved scalability by allowing multiple machines to maintain portions of the "to crawl next" queue. Query processing can also be split amongst machines, with different machines being responsible for documents of a given hash. Yioop! now supports mirroring of machines. Two word phrases as determined by an XML file such as Wikipedia URL dump can now be treated as a logical unit. The Yioop! model-view-controller framework has been made easier to extend and documentation for it has been added to the website.

2011-12-08 08:57
0.80

이 버전에는 시작, 중지 및 큐 서버 및 웹 인터페이스에서 fetchers 로그 파일 보기 지원 있습니다. 웹 인터페이스를 통해 활성 크롤링에 새 Url을 삽입할 지금 하나. 이 버전 Yioop의! 일 수가 고정된 된 후 페이지의 re-crawling를 지원 합니다. 또한, 크롤링 파일 확장명, 바이트 수가 페이지당 다운로드 어떻게 Yioop! 구성 요소 이제 모두 제어할 수 있습니다 그냥 config.php 파일 보다 웹 인터페이스를 통해 다른 페이지 무게. 또한 향상 되었습니다 HTML 프로세서 인덱스 텍스트를 추출 하는 방법에.
Tags: Minor
This version supports starting, stopping, and viewing log files of the queue server and fetchers from a Web interface. One can now inject new URLs into an active crawl via a Web interface. This version of Yioop! supports re-crawling of pages after a fixed number of days. Also, the file extensions that are crawled, the number of bytes downloaded per page, and how Yioop! weighs different page components can now all be controlled through a Web interface rather than just the config.php file. Improvements have also been made to how HTML Processor extracts text to index.

2011-10-29 11:40
0.78

문자 n 그램 형태소 분석기 없 여러 언어 지원 됩니다. 언어 검색 개선 되었다 및 다운로드에 대 한 utf-8 준비를 제공 하는 더 나은. Yioop!'bit.ly 리디렉션을 포함 한 다음 리디렉션의 능력 개선 되었다. 또한 문서에서 텍스트의 근접 점수 향상 되었습니다.
Tags: Minor
Character n-grams are now supported for many languages that did not have a stemmer. Language detection was improved and better UTF-8 preparation was provided for downloads. Yioop!'s ability to following redirects, including bit.ly redirects, was improved. Proximity scoring of text in documents has also been enhanced.

2011-10-03 00:53
Version 0.76

이 버전은 Yioop의 개 검색 결과 얻기 위해 API 함수 추가! 또한 오픈 RSS 응답 그 Yioop을 향상! 생성 하 고 이미지를 포함할 수 있습니다. 온라인 설명서 Yioop를 통합 하는 방법을 자세히 설명 하기 위해 향상 되었습니다! 사이트로 서. 이 릴리스에 또한 arc_tool 구문을 단순화 하 고 호 도구 내 능력을 손상 IndexArchiveBundle 사전 다시 추가. 이 버전에는 큰 인덱스에 손상 될 사전을 일으킬 수 있는 사전의 출력 버퍼링에 버그 수정.
Tags: Minor
This version adds a function API to get search results out of Yioop! It also improves the Open RSS Responses that Yioop! generates and allows them to contain images. The online documentation has been enhanced to describe in more detail how to incorporate Yioop! into a site. This release also simplifies the arc_tool syntax and adds the ability within arc tool to reindex a corrupt IndexArchiveBundle dictionary. This version fixes a bug in output buffering of the dictionary that could cause the dictionary to become corrupted on large indexes.

Project Resources