Download List

프로젝트 설명

docx2txt is a tool that attempts to generate equivalent text files from (even corrupted) Microsoft .docx documents, preserving some formatting and document information (which MS text conversion drops) along with appropriate character conversions for a good (ASCII) text experience.

It is a platform independent solution consisting of (core) Perl and (wrapper) Unix/Windows shell scripts and a configuration file to control the output text appearance to fair extent. It depends upon a commandline unzipping program (like unzip, 7z, pkzipc, or wzunzip) that can silently extract single files from zip archives to console/standard output/pipe.

It can very conveniently be used to build a Web based docx document conversion service. Some Makefiles and Windows batch files are provided for easy installation of the scripts. With unzippers like CakeCmd that can deal with corrupt Zip archives, this tool can extract text from corrupt docx documents in many cases, where MS word processor fails to even open them.

System Requirements

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2012-01-15 11:10
1.2

펄 스크립트에서 stdin, 입력 이제 취할 수 하며 또한 입/출력 리디렉션 작동 합니다. 스크립트 파일 및 구성 파일 (비 Windows) 시스템 설치를 위한 Makefile을 사용 하 여 별도 디렉터리에 지금 설치할 수 있습니다. 구성 파일은 지금 균일 하 게 보였다에 대 한 현재 디렉터리, 사용자 구성 디렉터리 및 시스템 구성 디렉터리 지정된 된 순서 대로. 특수 (비 텍스트) 문자의 처리 향상 되었습니다, 분수 처럼 더 많은 비 텍스트 문자에 대 한 지원과 함께.
Tags: Major feature enhancements
The Perl script can now take input from stdin, and also works with input/output redirection. Script files and the configuration file can now be installed in separate directories on (non-Windows) systems using Makefile for installation. The configuration file is now uniformly looked for in the current directory, the user configuration directory, and the system configuration directory, in the specified order. Handling of special (non-text) characters has been improved, along with support for more non-text characters, like fractions.

2011-12-13 07:28
1.1

부 비-추출 기능 향상 및 버그 수정, 사용자 로부터 받은 피드백/입력을 기반으로 합니다. 압축 해제 명령의 존재를 확인 합니다.
구성 파일은 $HOME 뿐만에 보였다. 구성 변수는 지금 config_로 시작합니다. 버그 # 3003903, # 3082018 및 # 3082035 해결 되었습니다. 시그윈에 대 한 null 장치 수정 되었습니다. 위 첨자 상호 참조는 [...] 내 지금 배치 됩니다.
Tags: Minor feature enhancements and bug fixes
Minor non-extraction feature enhancements and bugfixes, based on the feedback/input received from users. A check for the existence of the unzip command.
The configuration file is looked for in $HOME as well. Configuration variables now begin with config_ . Bugs #3003903, #3082018, and #3082035 have been fixed. The null device for Cygwin has been fixed. Superscripted cross-references are placed within [...] now.

2009-10-05 18:21
1.0

이것을 출시하였습니다 사용자 상호 작용 측면에 주로 초점을 맞추고. 새로운 기능 Windows 설치 스크립트, 윈도우 래퍼 스크립트를 지퍼를 분리, 구성 파일 및 디렉토리의 압축이 풀린 콘텐츠를 들고 작업에 대한 지원을 CakeCmd을 사용하여 지원됩니다. docx 파일을 엽니다. 거기에 짧은 선을 칭의의 처리에 향상되었습니다; 많은 경우는 이전에 접근을 못했다 캡처됩니다. 경로 이름에 공백이 포함된 지금 처리됩니다.
Tags: Major feature enhancements
This releases focuses mainly on user interaction aspects. The new features are a Windows installation script, a Windows wrapper script, support for using CakeCmd apart from Unzip, a configuration file, and support for working with a directory holding the unzipped content of .docx file. There has been improvement in handling of short line justification; many cases that were missed out in the earlier approach are captured. Path names containing spaces are now handled.

2009-09-06 16:43
0.4

하이퍼 링크의 표시 구성할 수있습니다. 목차 관련 정리를 완료했다. 많은 새로운 캐릭터 전환을 구현했다. 문자 변환 테이블에 추가되었습니다. 환율 문자를 전체 통화의 이름으로 변환됩니다. 코드 개조하면 되겠어 변환 프로세스 속도를 완료했다.
Display of hyperlinks is configurable. TOC related cleanup was done. Many new character conversions were implemented. Character conversion tables were added. Currency characters are converted to full currency names. Code tweaks were done to speed up the conversion process.

2008-09-24 14:06
0.3

피팅 센터와 텍스트를 오른쪽의 칭의 () 조정의 줄에 80 컬럼. 하이퍼 링크와 함께 하이퍼 텍스트의 표시. BSD에서 makefile을. 에서는 Windows 사용자는이 도구의 자세한 설명서를 사용할 수에 대한 몇 가지 제안. docx2txt.pl 호출 약간 변경되었습니다. 설치 중에 사용자 개입이 줄어 듭니다.
Tags: Minor feature enhancements
Center and right justification of text fitting in a line of (adjustable) 80 columns. Indication of hyperlinked text along with the hyperlink. A BSD makefile. Some suggestions on how Windows users can use this tool and more documentation. docx2txt.pl invocation has been changed a little. User involvement during installation is reduced.

Project Resources