久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

java linux文件出現中文亂碼怎么辦

1,231次閱讀
沒有評論

共計 4480 個字符,預計需要花費 12 分鐘才能閱讀完成。

這篇文章給大家分享的是有關 java linux 文件出現中文亂碼怎么辦的內容。丸趣 TV 小編覺得挺實用的,因此分享給大家做個參考,一起跟隨丸趣 TV 小編過來看看吧。

java linux 文件中文亂碼的解決辦法:1、下載 jdk1.8 的 sun 源碼;2、將 Font 的創(chuàng)建從物理字體改為邏輯字體;3、重啟服務即可。

本文操作環(huán)境:linux5.9.8 系統(tǒng),jdk1.8,Dell G3 電腦。

Linux 環(huán)境下 Java 中文亂碼解決方案

相信很多朋友遇到過 Java 的亂碼問題,最近我也在解決一個“使用文本生成圖片過程中中文以及特殊字符亂碼”的問題;花了我大量時間,Debug 了 sun.font、sun.awt 下面的各種源碼,終于搞懂了其機制,解決了目前次問題;現在把問題解決過程給寫下來,做個記錄,以免以后再次遇到。

遇到的問題

下面是我想要執(zhí)行的代碼(經過極度簡化,但是意思沒變):

public static void main(String[] args) throws IOException {
 File file = new File( test.png 
 Font font = new Font(宋體 , Font.PLAIN, 10);
 BufferedImage bi = new BufferedImage(400, 200, BufferedImage.TYPE_INT_ARGB);
 Graphics2D g2 = (Graphics2D) bi.getGraphics();
 g2.setBackground(Color.WHITE);
 g2.clearRect(0, 0, 400, 200);
 g2.setFont(font);
 g2.setColor(Color.BLACK);
 g2.setRenderingHint(RenderingHints.KEY_TEXT_ANTIALIASING, RenderingHints.VALUE_TEXT_ANTIALIAS_ON);
 g2.drawString(為什么沒有 (????)(????) 這名字特殊不?@¥¥¥  為什么沒有 (????)(????) 這名字特   , 0, 10);
 g2.dispose();
 ImageIO.write(bi, PNG, file);
}

目標當然是想在打開 test.png 的時候看到如下場景:

在本地調試沒問題之后,就放到了測試機(Linux)上面去執(zhí)行了,執(zhí)行結果簡直撲街:

jdk1.8 的 sun 源碼下載

奉行程序員一貫作風:既然有問題,那就 Debug!
坑爹的是現在的源碼包已經不包含 sun 包的代碼了!
幸好 java 官方確認 OpenJDK 的代碼基本和 JVM 源碼一致,可以直接從 OpenJDK8u 進行下載:jdk8u

至于如何使用源碼 debug,這個就不寫了··· 這都不會基本也就別看這文章了

定位問題

直接下載好源碼,遠程斷點,服務器執(zhí)行,在 debug 中先發(fā)現了第一個產生本地和測試服務器不一致的代碼:

原來 JVM 創(chuàng)建 Font 的時候會使用 FontManagerFactory 獲取 FontManager,而不同的系統(tǒng)使用的 FontManager 是不同的!Mac 用的是 CFontManager,而 Linux 用的是 X11FontManager!

那么這兩個 FontManager 的不同會導致什么不同呢?

CFontManager 會創(chuàng)建 CFont 作為 Font2D,這個 CFont 是 JVM 專門為 mac 創(chuàng)建的類,看類和方法的注釋可以知道在 mac 環(huán)境下有時候物理字體會被 CFont 包裝,而這是在 native 代碼中完成的:

X11FontManager 創(chuàng)建的 Font2D 是包含了邏輯字體和物理字體的集合。X11FontManager 繼承了 FcFontManager,FcFontManager 繼承了 SunFontManager;我們看一下 X11FontManager 的 loadFonts()方法,直接使用了 SunFontManager 的 loadFonts(),SunFontManager 的 loadFonts()方法加載了物理字體,SunFontManager 實現了 FontManager 的 preferLocaleFonts()方法,加載了邏輯字體:

邏輯字體與物理字體

代碼 debug 到這邊基本已經確認了是不同環(huán)境的字體加載問題,那么在 debug linux 環(huán)境的時候發(fā)現的邏輯字體和物理字體是什么東西呢?

物理字體

物理字體是實際的字體庫,包含字形數據和表,這些數據和表使用字體技術(如 TrueType 或 PostScript Type 1)將字符序列映射到字形序列。Java Platform 的所有實現都支持 TrueType 字體;對其他字體技術的支持是與實現相關的。物理字體可以使用字體名稱,如 Helvetica、Palatino、HonMincho 或任意數量的其他字體名稱。通常,每種物理字體只支持有限的書寫系統(tǒng)集合,例如,只支持拉丁文字符,或者只支持日文和基本拉丁文。可用的物理字體集合隨配置的不同而有所不同。要求特定字體的應用程序可以使用 createFont 方法來捆綁這些字體,并對其進行實例化。

邏輯字體

邏輯字體是由必須受所有 Java 運行時環(huán)境支持的 Java 平臺所定義的五種字體系列:Serif、SansSerif、Monospaced、Dialog 和 DialogInput。這些邏輯字體不是實際的字體庫。此外,由 Java 運行時環(huán)境將邏輯字體名稱映射到物理字體。映射關系與實現和通常語言環(huán)境相關,因此它們提供的外觀和規(guī)格各不相同。通常,為了覆蓋龐大的字符范圍,每種邏輯字體名稱都映射到幾種物理字體。

問題解決

debug 的源碼很多,但是此次問題的關鍵點就在這里了,其它 debug 內容就不貼了。
既然已經確認了本地(mac 環(huán)境)是 native 的代碼幫我們做了物理字體的封裝,轉換成了 CFont 進行渲染,而 Linux 環(huán)境的 X11FontManager 只是幫我們加載了物理字體和邏輯字體,但是卻需要我們自己進行選擇,那么解決問題的第一步就顯而易見了:將 Font 的創(chuàng)建從物理字體改為邏輯字體

1 // Serif、SansSerif、Monospaced、Dialog  和  DialogInput  隨意選擇
2 Font font = new Font(Serif , Font.PLAIN, 10);

改完以后執(zhí)行代碼,仍然是亂碼!繼續(xù) Debug,發(fā)現是 Linux 上邏輯字體 Serif 映射的物理字體沒有中文字體和對應的特殊符號字體,這就很簡單了,直接在 Linux 上安裝中文字體(simsun.ttf),再安裝特殊符號“????”可顯示的字體(mysi.ttf),將這兩個字體也放到了 jdk 的 fonts 目錄(JAVA_HOME/jre/lib/fonts)下。文章后面有 Linux 字體安裝方法。

完成上面的改動之后,重啟服務,再次執(zhí)行成功顯示!熱烈慶祝~~~~

JVM 邏輯字體映射配置

以上的改動已經可以解決中文和特殊字符亂碼問題,但是我在 Debug 過程中發(fā)現在邏輯字體加載過程中,JVM 會參考一個配置文件,代碼在 sun.awt.FontConfiguration 中,這個配置類完成了邏輯字體和物理字體的映射,也指導了 SunFontManager 創(chuàng)建邏輯字體,而這個 FontConfiguration 讀取的配置文件就是 fontconfig.properties,這個配置文件目錄是 JAVA_HOME/jre/lib

查閱了一下資料,JVM 字體配置文件的加載順序如下:
JAVA_HOME/jre/lib/fontconfig.OS.Version.properties
JAVA_HOME/jre/lib/fontconfig.OS.Version.bfc
JAVA_HOME/jre/lib/fontconfig.OS.properties
JAVA_HOME/jre/lib/fontconfig.OS.bfc
JAVA_HOME/jre/lib/fontconfig.Version.properties
JAVA_HOME/jre/lib/fontconfig.Version.bfc
JAVA_HOME/jre/lib/fontconfig.properties
JAVA_HOME/jre/lib/fontconfig.bfc

OS 是系統(tǒng),例如:Linux、CentOs、RedHat 等;Version 是版本號

在這個配置文件中可以修改邏輯字體與物理字體的對應關系,也就是說可以手動的修改 Serif、SansSerif、Monospaced、Dialog 和 DialogInput 這五個邏輯字體在不同場景下所使用的真正物理字體。

舉個栗子,下面的配置將 serif.plain 邏輯字體的中文使用 simsun.ttf,拉丁文使用 java 自帶字體:

# @(#)linux.fontconfig.SuSE.properties 1.2 03/10/17
# Copyright 2003 Sun Microsystems, Inc. All rights reserved.
# Version
version=1
# Component Font Mappings
serif.plain.chinese=-misc-simsun-medium-r-normal--*-%d-*-*-c-*-iso10646-1
serif.plain.latin-1=-b h-lucidabright-medium-r-normal--*-%d-*-*-p-*-iso8859-1
# Search Sequences
sequence.allfonts=latin-1,chinese
# Exclusion Ranges
# Font File Names
filename.-misc-simsun-medium-r-normal--*-%d-*-*-c-*-iso10646-1=/usr/share/fonts/myfonts/simsun.ttf

Linux 安裝字體

Linux 字體目錄:/usr/share/fonts

在 fonts 下面新建一個目錄,例如:mkdir myfonts

將需要安裝的字體放到新建目錄下面,例如:cp ~/test/simsun.ttf /usr/share/fonts/myfonts

進入到 myfonts 目錄:cd /usr/share/fonts/myfonts

執(zhí)行如下命令:

mkfontscale

mkfontdir

fc-cache -fv

查看是否已經安裝對應的字體:fc-list

fc-cache -fv 命令用來刷新 linux 的字體緩存,使其立刻生效

PS:以上所有操作基本都需要 root 權限

感謝各位的閱讀!關于“java linux 文件出現中文亂碼怎么辦”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

正文完
 
丸趣
版權聲明:本站原創(chuàng)文章,由 丸趣 2023-08-16發(fā)表,共計4480字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發(fā)布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 五指山市| 潮州市| 龙陵县| 宾阳县| 蓝山县| 易门县| 新安县| 金湖县| 峨山| 昭平县| 株洲市| 苏尼特右旗| 石屏县| 黑河市| 松潘县| 宝清县| 洛川县| 永吉县| 武穴市| 商洛市| 定州市| 牡丹江市| 博爱县| 思茅市| 安泽县| 沈阳市| 日照市| 衡山县| 金乡县| 江孜县| 绵阳市| 马关县| 昌邑市| 泰州市| 南和县| 德江县| 颍上县| 抚宁县| 荣昌县| 连城县| 乌拉特前旗|