it-swarm-ko.com

파일의 최고 압축률 (웹 전송 용)?

700MB의 데이터를 약 30-50MB로 압축하는 것과 같이 고도로 압축 된 파일을 보았습니다.

그러나 그러한 압축 파일을 어떻게 얻을 수 있습니까? WinRAR 및 7Zip과 같은 소프트웨어를 사용해 보았지만 이렇게 높은 압축률을 얻지 못했습니다.

파일을 잘 압축 할 수있는 기술/소프트웨어는 무엇입니까?

(추신. Windows XP를 사용하고 있습니다.)

16
rzlines

데이터를 압축하는 데 걸리는 시간이 문제가되지 않는 경우 여러 도구를 함께 사용하여 압축 크기를 최적화 할 수 있습니다.

7Zip, winrar (Zip 용) 및 bjwflate와 같은 다른 도구를 사용하여 데이터를 여러 번 압축합니다.

(이것은 Zip 파일을 계속해서 압축하는 것이 아니라 다른 도구를 사용하여 여러 개의 대체 Zip 파일을 만드는 것을 의미합니다.)

다음으로 각 아카이브에서 deflopt 를 실행하여 각 아카이브를 조금 더 줄입니다.

마지막으로 아카이브 컬렉션에서 zipmix 를 실행합니다. 다른 Zip 도구가 다른 파일에서 더 좋기 때문에 zipmix는 각 아카이브에서 각 파일의 최상의 압축 버전을 선택하고 Zip 도구가 개별적으로 생성 할 수있는 것보다 작은 출력을 생성합니다.

그러나 이것이 파일에서 어떤 종류의 마법도 작동한다고 보장되지는 않습니다. JPEG 및 MP3와 같은 특정 유형의 데이터는 단순히 잘 압축되지 않습니다. 이러한 파일은 이미 내부적으로 압축되어 있습니다.

11
izb

이는 전적으로 압축되는 데이터에 따라 다릅니다.

텍스트는 잘 압축되고 바이너리 형식은 잘 안되며 압축 된 데이터 (mp3, jpg, mpeg)는 전혀 압축되지 않습니다.

다음은 wikipedia의 좋은 압축 비교 테이블 입니다.

12
Nifle

이전 답변은 매우 잘못되었습니다!

내가 개인적으로 경험 한 최고의 압축 알고리즘은 paq8o10t ( zpaq 페이지 및 PDF 참조) .

힌트 : files_or_folders를 압축하는 명령은 다음과 같습니다.

paq8o10t -5 archive files_or_folders

Archive size vs. time to compress and extract 10 GB (79,431 files) to an external USB hard drive at default and maximum settings on a Dell Latitude E6510 laptop (Core i7 M620, 2+2 hyperthreads, 2.66 GHz, 4 GB, Ubuntu Linux, Wine 1.6). Data from 10 GB Benchmark (system 4).

출처 : 증분 저널링 백업 유틸리티 및 아카이버

GitHub 에서 소스 코드의 미러 본을 찾을 수 있습니다.


약간 더 나은 압축 알고리즘과 Hutter Prize 의 우승자는 decomp8입니다 (상금 페이지의 링크 참조). 그러나 실제로 사용할 수있는 압축기 프로그램은 없습니다.


really 대용량 파일의 경우 lrzip 단순히 comical 인 압축 비율을 얻을 수 있습니다.

README.benchmarks의 예 :


Linux-2.6.31에서 linux-2.6.36으로 한 버전 씩 다른 6 개의 커널 트리를 가져와 보겠습니다. 많은 중복 정보가 표시되지만 수백 메가 바이트가 떨어져서 lrzip이 압축에 매우 적합합니다. 단순함을 위해 7z 만 비교 될 것입니다. 현재로서는 최고의 범용 압축기이기 때문입니다.

이는 lrzip v0.5.1을 사용하여 4GB 램이있는 2.53Ghz 듀얼 코어 Intel Core2에서 수행 된 벤치 마크입니다. 32 비트 사용자 공간으로 실행되었으므로 2GB 주소 지정 만 가능했습니다. 그러나 벤치 마크는 -U 옵션으로 실행되어 전체 파일을 하나의 큰 압축 창으로 처리 할 수 ​​있습니다.

6 개의 연속 된 커널 트리의 Tarball.

Compression    Size                 Percentage      Compress    Decompress
None           2373713920           100             [n/a]       [n/a]
7z             344088002            14.5            17m26s      1m22s
lrzip          104874109            4.4             11m37s      56s
lrzip -l       223130711            9.4             05m21s      1m01s
lrzip -U       73356070             3.1             08m53s      43s
lrzip -Ul      158851141            6.7             04m31s      35s
lrzip -Uz      62614573             2.6             24m42s      25m30s
9
Alexander Riccio

Squeezechart.com 다양한 압축률 비교가 포함되어 있습니다. Nifle의 답변에서 언급했듯이 바이너리 형식에 대해 높은 압축률을 얻을 가능성은 거의 없습니다.

3
idan315

전체 압축 벤치 마크를 구성하는 최상의 압축 목록 이있는 다중 파일 압축 벤치 마크 테스트 요약 을 확인하십시오.

상위 30 개

enter image description here

이 테스트에서 최고 성능 (압축 기준)은 PAQ8 및 WinRK (PWCM)입니다. 300 + Mb 테스트 세트를 62Mb 미만으로 압축 할 수 있지만 (크기 80 % 감소) 테스트를 완료하는 데 최소 8.5 시간이 걸립니다. 1 위 프로그램 (PAQ8P)은 테스트를 완료하는 데 거의 12 시간이 걸리고 4 위 (PAQAR)는 17 시간이 걸립니다. 2 위 압축률 (79.7 %)의 프로그램 인 WinRK는 약 8.5 시간이 걸립니다. 당연히 언급 된 모든 프로그램은 압축을 위해 PAQ (유사) 엔진을 사용합니다. 이미지가 포함 된 파일 (예 : Word DOC 파일)을 사용하는 경우 PAQ8을 사용하면 해당 파일을 인식하고 별도로 압축하여 압축률이 크게 향상됩니다. WinRK 제외) 언급 된 모든 프로그램 (WinRK 제외)은 무료입니다.

3
LifeH2O

대부분의 압축 도구에는 더 느린 압축/압축 풀기 시간과 더 많은 RAM 사용량의 절충안에서 더 높은 압축률을 달성 할 수있는 설정이 있습니다.

7-Zip의 경우 기본 제공 도움말에서 "아카이브에 추가 대화 상자"를 검색하여 자세한 내용을 확인하십시오.

2
Tom Robinson

다음 울트라 설정으로 7Zip을 시도 할 수 있습니다.

7z a -t7z -m0=lzma -mx=9 -mfb=64 -md=32m -ms=on big_file.mysql.7z big_file.mysql
2
kenorb

Nanozip FreeArc와 함께 압축률이 가장 높은 것으로 보입니다. 그러나 아직 최종 버전이 아닙니다. Nanozip 압축이 얼마나 좋은지 가 있습니다. 압축률이 매우 높고 시간이 너무 많이 걸리지 않습니다. 다중 파일 압축 벤치 마크 테스트 요약 확인하지만 FreeArc가 더 빠릅니다.

1
user712092

여기서 가장 좋은 방법은 시행 착오 인 것 같습니다. 각 파일에 대해 사용 가능한 모든 압축 기술을 시도하고 웹 사이트에 가장 적합한 것을 선택하십시오. 운 좋게도 컴퓨터는 이런 종류의 일을 매우 빠르게 수행하고 지루하지 않습니다. 프로세스를 자동화하는 간단한 스크립트를 작성하면 "상대적으로 고통스럽지"않습니다.

기적을 기대하지 마십시오. 700MB에서 30MB까지 그렇게 자주 발생하지 않습니다. 위에서 언급 한 로그 파일-예. "평범한 파일"-절대 안돼.

1
hotei