377コメント121KB

ja_JP.UTF-8

スレをまとめに
5ch即うp → gzo.ai

■ このスレッドは過去ログ倉庫に格納されています

1login:Penguin

04/02/19 17:09ID:EuXdEmYH

Linux で ja_JP.UTF-8 ロケールで暮らす方法についてのスレです。

136login:Penguin

04/06/15 00:19ID:1nIdf8BO

>>134
EUC撲滅のスレッドに見えますが…
スレ違いという理由で誘導されてるのに話題が出ているというだけの理由で
スレ違いのスレッドに案内されても困ります。
それともうにこーだーはすべからくEUCの撲滅を望まなければなりませんか

137login:Penguin

04/06/15 07:49ID:+9gsKEDe

>>136
スレタイはアレだけど
中身は文字コード総合スレだよ。

138login:Penguin

04/06/17 10:41ID:TUtqbBWf

xpdf って、UTF-8 に対応してますか？日本語表示できる PDF ファイルと、できない PDF ファイルがあって、どうやら、MS Office で作成した PDF ファイルがダメっぽいので、UTF-8 のせいかな、なんて思ってます。

139login:Penguin

04/06/17 14:51ID:Wuxldr94

>>137
文字コードスレ2つも要らんだろ。
削除依頼よろぴく。

140login:Penguin

04/06/19 01:35ID:hBPlVOmh

だからここは文字コードスレじゃないと主張してるんだろ。
それとも>>134以外に文字コードスレがあるの?

141へりくつ星人

04/06/27 16:21ID:o/ZzpKCM

１を見れば分かるように、ここはﾛｹｰﾙのスレで
あって、文字コードのスレではありません。「たまたま」
utfの話題が多いだけなのです。

142login:Penguin

04/06/28 00:15ID:Tve7N2OE

最近はみんな満足してるのかな？
俺は tcsh に utf-8 パッチをあてたものを使ってるんだが、
ロシア語とか■とか、そういう端末上での文字幅があいまいな文字が
のきなみ半角扱いになってしまって、
ずれるんだよな。
emacs + mule-ucs でも同様なのでずれるんだよな。
どうしたもんかしら(´・ω・｀)

143login:Penguin

04/06/28 06:24ID:fWk93VUD

>>123
UNICODEの文字セットを日本語2バイトで扱う符号UTFCP2がある:
ttp://www.nowsmartsoft.or.tv/nws/Japanese/chara_code_compare.htm
特徴は2バイトのコードポイント数が非常に大きいこと、状態非依存であること、
正確にテキストを逆戻り可能なこと。

144login:Penguin

04/06/28 06:37ID:LgxqrPnR

LightCone乙

145login:Penguin

04/07/28 04:36ID:lpc0mwrw

test

146login:Penguin

04/08/10 16:05ID:jpxCYepz

てｓｔ

147login:Penguin

04/08/24 23:47ID:+PM77uqo

>>143
UTFCP2
これただのネタじゃん

148login:Penguin

04/08/25 00:16ID:SpZWXCwV

何を今更

149login:Penguin

04/11/06 05:16:52ID:zrKtV3hP

http://www.ganaware.jp/archives/000060.html

150login:Penguin

04/11/08 10:07:11ID:lMXPbsp8

何を今更

151login:Penguin

04/12/04 21:05:30ID:6+KTXyp/

>>142
ずれないようにするにはターミナルエミュレータ(xtemとか)とエディタ (emacs
とか)の両方で全角半角判定が共通である必要がある。で、上の方で
1. 判定には何を使うべきか? wcwidth()/wcswidth()? その他?
2. 判定結果はどうあるべきか
... という話があったわけだが、結論は (ry
せめて 1. がこの世のすべての CUI なプログラムで統一されればずれなくなるん
だけどねー。

最近自分もこの問題に巻き込まれてしまった... orz

152login:Penguin

04/12/04 21:24:29ID:Ac1hFSyz

>>151
最近は端末エミュレータに ck を使っているのですが、
ck （や xterm) は半角/全角があいまいな文字を
半角で表示するか全角で表示するか選択可能なので、
すこしマシになりました。

153login:Penguin

04/12/04 21:25:47ID:5ZS2CgHD

>>151
統一できないから問題があるというか、統一できないような文字を
同一の文字として統合してしまった仕様に問題があるというか。

154login:Penguin

04/12/04 21:33:56ID:ziFkWoAh

サロゲートペア考えたやつは死刑

155login:Penguin

04/12/04 21:39:06ID:uTy9W2B7

>>154 うむ。あんな変なことするくらいなら、
素直に UCS4 で良かったのにな。

156中の人

04/12/04 22:01:59ID:b+GZcVVR

だって16bitで十分だと思ったんだもん…

157login:Penguin

04/12/04 22:16:44ID:6+KTXyp/

>>152
へーそうなんですか。曖昧な文字をすべて全角か半角か一方にすればとりあえず
困らないって感じですか?
実装をチェックしてみねば... どのみち、既存の wcswidth() を使ったら OK、という
ような単純なものではなさそうで。

全角半角問題に関しては、逆に CUI 系のプログラムから全角/半角という概念を
捨てきれればいいのかも。常に1文字1カラムで、ターミナルとかで既存の
挙動をしてほしかったらフォントのメトリックで対処すればいいとか。
(可変幅のカラムといいますか... アルファベットが等幅&日本語の文字幅がアル
ファベットの2倍にデザインされたフォントを使う)
って、これって問題をフォントのデザインに押し付けただけ?

あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
メトリックを計算させる必要があるとしたら (w

やっぱ Unicode がイカン、ということで。

158login:Penguin

04/12/04 22:34:42ID:b+GZcVVR

>>157
> あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
> ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
> メトリックを計算させる必要があるとしたら (w

mozillaのxmltermどうよ?

159login:Penguin

04/12/04 22:40:54ID:6+KTXyp/

>>153
確かに。
で、とりあえず話を全角半角問題(?)に絞ると
wcwidth() が
1. 既存のエンコーディングを使うロケール (e.g ja_JP.eucJP)のときは、それらしく動く
(EUC-JP で2バイトな文字は全角、それ以外は半角 <- って、これも問題があるような)
2. Unicode を使うロケール( e.g. ja_JP.UTF-8) のときは
とりあえず EUC-JP -> UTF-8 にマッピングがある文字は 1. と同じ挙動。
ないものは、その他のロケールを探して(e.g. zh_CN.eucCN)、1. と同じような
判定ができればそれを採用。(できない場合は...)
みたいな挙動をしてくれたら、皆でそれを使えばいいような気がするんですが。。。
Ambiguous 云々というのは Unicode をベースに考えるからで、では既存のエンコーディング
をベースに考えると、こういうことになるのではないかと思いますが。。。
どのみち旧来の全角半角というのがあまり明快な考え方ではないので、決め方自体はすっきりしませんが、上のようにすれば、文字幅は地域コードのみに依存してエンコーディングに
は依存しないかなと。

160login:Penguin

04/12/04 22:47:51ID:RHj7f47U

EUC-JPの半角カナは２バイトだよ・・・??

161login:Penguin

04/12/04 22:48:37ID:6+KTXyp/

>>158
>mozillaのxmltermどうよ?
う、使ったことないけど、もしかして表示の整列とかを賢くやってくれちゃうのかな?
いろいろ疑問がわくけど (ry とりあえず後で使ってみます。

眠くなったきたので休憩...

162login:Penguin

04/12/04 22:54:15ID:5ZS2CgHD

>>159
同一ホスト、同一ロケールならそれでなんとかなるが、
端末ソフトの場合はロケールやホストが異なるものが
混じるかもしれないからそんな単純にはいかない。

>>160
3バイトじゃなかったっけ？

163login:Penguin

04/12/04 22:57:36ID:b+GZcVVR

>>162
> 3バイトじゃなかったっけ？

そりゃ補助漢字でしょ。半角かなはSI/SO + 文字で2byte。

164login:Penguin

04/12/05 07:11:53ID:3PBNWURc

Unicode 絡みの話題と言えば、最近 Mac OS X のバージョンが変わると特定の文字のコードが変わるとか言う話があったね。
http://slashdot.jp/article.pl?sid=04/11/30/1014219&topic=11&mode=nested
まぁドラフト段階の字形-コードの対応表を使っちゃった Apple が悪いんだけどさ。

ところで、「字形-コードの対応表」って専門用語ではなんて言うの？

165login:Penguin

04/12/05 11:35:33ID:U+jxCrh2

Coded Character Set

166login:Penguin

04/12/05 12:27:30ID:3PBNWURc

>>165 符号化文字集合…か。

167login:Penguin

04/12/05 22:36:47ID:U+jxCrh2

>Coded Character Set(CCS)
説明不足だった。これは文字毎に一意の番号を振ってある文字集合。
JIS X 0208とか、UCS-2とかがそれ。

CCSをどういうバイト列で表すかがCharacter Encoding Scheme(CES)。
EUC-JPとかUTF-8とかがそれ。

ただ、字形じゃなくて文字概念に番号がついてるから、どっちも
厳密には>>164の言ってるものじゃないのかも。

AdobeのCIDは字形に番号が振ってあるな。

168login:Penguin

04/12/15 17:38:23ID:CmtNvJ+T

xmlterm、まだ使ってないけどスクリーンショットでそのコンセプトはわかった
気がする。ターミナルを一種のブラウザと考えるとああなるのかな。
今までのターミナルはプレーンテキスト専用のブラウザとも言える訳だ。

こうなったら、ウェブブラウザもファイルブラウザもターミナルも
全部統合した UI を目指す事にします。ってどこかで見た気が...

169login:Penguin

04/12/15 20:35:16ID:AiVgzkM7

餅は餅屋ということわざを教えてあげたい

170login:Penguin

04/12/15 23:06:31ID:pwu6u1JE

和菓子屋の餅も旨いよ。

171login:Penguin

04/12/15 23:18:48ID:v6Owr1lz

佐藤の切り餅って超まずいね。というか餅じゃない。
あんな餅を餅だと思って食べている人がいるかと思うと
かわいそうだ。

172login:Penguin

04/12/29 01:17:45ID:3YiZNVoJ

173login:Penguin

05/01/18 15:41:07ID:Wb3X1dyN

>>171

十分うまいよ。

174login:Penguin

05/02/26 04:56:11ID:OxqQlLig

Mac OS X,で使われているUTF-8 with NFDを扱おうとおもって、
http://www.opensource.apple.com/darwinsource/10.3.8/
からAppleハック済みのlibiconvをx86のlinuxでコンパイルしてみました。
configureもmakeも問題なくできるのだけれども、iconv -f UTF-8-MAC -t UTF-8 等としてもどうもうまく動かないんです。
(Mac OS Xでコンパイルすると問題なく動きます。)
どうもエンディアンの問題臭いのですが、自力では解決できず...
netatalkのUTF-8 with NFDの実装が一番上手な気がするのですが、そこからもってくるのは難しいので困っています。
どなたかNFDからComposed Formに変換する方法をご存知の方はいらっしゃいますか？

175login:Penguin

05/03/07 02:10:29ID:233WSAJL

なんで UTF-8 の変換にエンディアンが関係するんdayo!
って一瞬思ったけど、iconv の内部的には一旦 UTF-16 とかにしてるのかな?
Apple のハックのせいなんなら普通の libiconv と比較してみたらいいんじゃねーの?
それか普通の libiconv にその UTF-8-MAC を追加する方向で修正してみるとか
...ってのができないわけね。
Mac OS X が使えるなら Mac OS X 上で変換してから他のプラットフォームに持って
いくんじゃ駄目なのか?

176login:Penguin

05/03/07 12:53:14ID:v/gznSFy

>>174
> configureもmakeも問題なくできるのだけれども、
> iconv -f UTF-8-MAC -t UTF-8 等としてもどうもうまく動かないんです。

How?

177login:Penguin

05/03/08 12:02:39ID:FpUM9LjU

ja_JP.UTF-8 ロケールでeuc-jpのnfs鯖をマウントするときみんなどうやってるの？
（sambaや、webdav使えばできるんだけどネ、nfsでの解決策を教えてね）

178175

05/03/08 12:30:30ID:p+KoiNpg

問題が本当にエンディアンのせいなら、utf8mac_mbtowc() が呼んでいる
utf8_decodestr() の引数に UTF_REVERSE_ENDIAN をセットしてみたらいいかも。
ハードコーディングになっちゃうけど。
それで駄目だったら >>176 の回答待ちか。

179174

05/03/10 00:01:21ID:AGM4jA9o

>>176

http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-9.tar.gz
をダウンロードして、
./configure --enable-static=yes --enable-shared=no --disable-nls --prefix=/opt/mac
としてconfigureしてmakeして、スタティックリンクしたバイナリを作って実験してみました。

ls | iconv -f UTF-8-MAC -t UTF-8
で、NKDな文字がちゃんと出てくるか調べてみたのですが、めちゃくちゃな文字化けしか起こりませんでした…

>>178
UTF_REVERSE_ENDIANをセットしてみてもしなくてもですが、めちゃくちゃに文字が化けてしまいました。

一つ怪しいかなと思うのが、
utf8mac.h: In function `utf8mac_mbtowc':
utf8mac.h:1566: warning: passing arg 6 of `utf8_decodestr' makes integer from pointer without a cast
なんてwarningがでるんですが、もしかしてこれのせいでPowerPCでしか動かないコードになっていることなんです。

でもCが全くわからないので意味はわからないのですが…

180login:Penguin

2005/06/06(月) 13:22:58ID:1kxaCCcu

>>179
気になったので試してみたけど、
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-10.tar.gz
や
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-13.tar.gz
なら

-#include <libkern/OSByteOrder.h>
+//#include <libkern/OSByteOrder.h>
+#include <byteswap.h>
+#define OSSwapInt16(x) bswap_16(x)
+#define __LITTLE_ENDIAN__

という変更でいけるみたい。

181naruse

2005/07/07(木) 20:26:04ID:Ajp7X6MQ

nkfの最新のCVS版で、
nkf -w --utf8mac-input hoge.txt
などとすればUTF-8-MACをUTF-8に変換できる・・・はずです。
うまくいかない場合は教えてください。

182login:Penguin

2005/07/13(水) 03:15:25ID:GiU0rXXK

183login:Penguin

2006/01/10(火) 14:40:21ID:s0uQ10WF

あけおめage

184login:Penguin

2006/01/18(水) 17:33:51ID:1b8YR8q0

フェどらって、OSの仕様をかえればすぐにソフトの仕様もかわると思ったのかな？

185login:Penguin

2006/01/21(土) 16:33:52ID:e7e/lB8H

「すぐに」とは思ってないんじゃない。

186login:Penguin

2006/02/01(水) 08:31:41ID:H6kL8c39

使っているOSがUTF-8なのかEUC-JPなのか
簡単に判別する方法はあるでしょうか？

とりあえず、今1CDのGeeXboXを日本語対応化してみていますが
USBメモリー(vfat)上のファイル名は正常に表示されますが
HDD上のファイルがうまくいっていません。

たぶん、このHDDへのファイル保存をVineでやっているので
未だEUC-JPのVineだってところか
あるいはGeeXboX側のmount optionの問題か…手詰り。

UTF-8標準に向かったディストリビューションには
ファイル名をUTF-8化するコマンドがあるようですが
とりあえず、Vineではapt-getはできないようで…

いっそ、UTF-8標準のディストリビューションを入れちゃうか？と思ったり。
それとも、FedoraCoreからconvmvのソースとってくるほうが速いのか？
どちらにしろ、もう遅刻する時間を過ぎているので出勤しまつ orz

ちなみに、GeeXboXはlibsmbなんとかやfstabが
ラムディスクイメージの中にあるので、今私には手が出せません。

#気の迷いでパソコン一般板にGeeXboXスレ立て公開中

187login:Penguin

2006/02/01(水) 10:57:17ID:5OoK6VSB

age
OS が UTF-8 ってのは
UTF-8 対応のロケールが入っているかどうか？という意味なんでしょうかね。

188login:Penguin

2006/02/01(水) 11:00:41ID:fQfoX2Vz

>>187
だね。kernelはutf-8対応なんかしちゃいないよ。

189login:Penguin

2006/02/01(水) 13:51:37ID:IyxnkmjE

>>188
ん？VFATとかsmbfsなどのNLSにUTF-8が入ってるけど？
他のUTF-8/16なOSとファイルレベルで互換とらないといけないFilesystemはカーネルレベルでNLSサポートしてますよん。

190login:Penguin

2006/02/01(水) 15:11:08ID:fQfoX2Vz

それドライバの話でしょ。カーネルからはNUL端の文字列にすぎないよ。

191login:Penguin

2006/02/01(水) 16:05:56ID:qAxvh4Kn

ドライバがカーネルかどうかなんでどうでもいいから

192login:Penguin

2006/02/01(水) 18:36:18ID:/PUwsy/N

カーネルをソースからコンパイルするときに
ファイルシステムのエンコーディングを
UTF-8だのSJISだのEUCだの指定できるのはなんなんだろうね。

193login:Penguin

2006/02/01(水) 21:30:09ID:/ik9G5r3

>>192
ファイルシステムドライバへの指定だから、どのみち>>191だとおもわれ

194login:Penguin

2006/02/01(水) 22:51:36ID:axKot8bp

EUCで書かれたシェルスクリプトをUTF-8でごちゃごちゃいじって、
おなじファイルなのに容量が増えることに愕然としたりして、
それでもいじってとりあえず動くものができたんですが、

日本語の文字化け以外にはやう゛ぁイことって何も無いですよね?

195login:Penguin

2006/02/02(木) 09:08:46ID:Gkp5Be+f

おまえ

196186

2006/02/02(木) 21:37:38ID:I2B8ecnQ

とりあえず、LOCALEの設定箇所を調べて
そこを確認すればわかるってことでいいようですね。

それはそうと、アクセス規制の一日の間に
convmvでUTF-8ファイル名にしたら当座の目的は解決。

ともかく、ありがとうございました。

197login:Penguin

2006/03/09(木) 13:51:20ID:Bujq6YPa

はじめてRedHatES4いれてみた。

# /etc/init.d/xinetd reload
繹・秧莨若榛 [ OK ]

ってな出力がUTF-8ででてるっぽいんだけど
これってEUC-JPに変更できないのかなあ。
ES3まではEUC-JPだったのに。

198login:Penguin

2006/03/09(木) 13:53:14ID:kx4zcmdN

>>197
Red Hat Enterprise Linux スレッド part 24
http://pc8.2ch.net/test/read.cgi/linux/1136544255/

199login:Penguin

2006/03/09(木) 15:10:08ID:LBUAWqfA

玄箱を Debian 化して、locale を utf8 にして、日本語manを入れたら、
euc-jp で書いてあって文字化け。orz

200login:Penguin

2006/03/09(木) 18:00:07ID:kAtX1v8U

gentooの事例だけど
ttp://wiki.gentoo.gr.jp/index.php?%5B%5Btips%BD%B8%5D%5D#content_1_5
ttp://www.jaro68.org/needlejuice/blog/206
ttp://www.sen2or.com/index.php?itemid=1003

201login:Penguin

2006/03/12(日) 01:04:13ID:fe5y18+Z

>>192
ファイルシステムにエンコーディングは関係ない
ファイル名を決めるのはカーネルじゃないってわからない?

202login:Penguin

2006/03/12(日) 01:34:49ID:zOXA93u/

ファイルシステムにエンコーディングは関係あるし。

203login:Penguin

2006/03/12(日) 02:24:44ID:/fczP50N

>>202
どういう意味だろう?
とあるロケールで使用する文字コードが
ファイル名として使える文字コードの範囲内に入ってれば
何の問題も無いと思うんだが

例えばUTF-8のディストリでも、シコシコ設定書き直せば
システム全体の文字コードをEUCにもSJISにもできるわけで

204login:Penguin

2006/03/12(日) 02:51:32ID:Qy+1QTbg

>>203
CONFIG_NLS_*
mount iocharset=*
を調べるか、黙って。

205login:Penguin

2006/03/12(日) 03:56:15ID:K2J5B9uh

>>204
NLSやcharsetはエンコードと関係あるが
カーネルがエンコードしている事の証明にはならないわけで＾＾；
「黙って」ほしいなら
「お願いですからこれ以上つっこまないでください」と懇願した上で
お前が黙れｗ

206login:Penguin

2006/03/12(日) 04:11:48ID:Qy+1QTbg

つfs/nls/*.c, fs/*fs/*.c

207login:Penguin

2006/03/12(日) 04:38:25ID:zOXA93u/

>>205
んじゃ NLS や charset は何がつかってるの？
ファイルシステムはドライバでカーネルじゃないとか言うつもりかｗ

208login:Penguin

2006/03/12(日) 12:48:03ID:/fczP50N

>>204
エンコードはしないが関係無くは無いって事か?
トンチが効いているが言い訳っぽいな…

209login:Penguin

2006/03/12(日) 15:19:01ID:Oc3RTicA

たとえば'/'をディレクトリの区切りと見なしてるのは、ファイルシステム
だけじゃないと思うんだな。(思うだけでソース見て回ったわけじゃないが。)
とすると、8ビットクリーンな環境ならばファイル名がutf-8やeuc-jpは問題
ないが、iso-2022(-jp)やShift_JISを使うのには困る。

210login:Penguin

2006/03/12(日) 18:10:19ID:MT19Gksr

>>209
禿同。

211login:Penguin

2006/03/12(日) 20:27:33ID:ydqBlaR7

>>208
ん? iso-2022-jpを使ってファイルを取扱うシステムなんてあんの

212login:Penguin

2006/03/13(月) 00:57:05ID:8cnv7aJ6

あらら極論を持ち出して・・・

213login:Penguin

2006/03/14(火) 15:01:37ID:ZJm9Ix4t

File system 自身が '/' という「文字」を抱え込んでるってのか？

214login:Penguin

2006/03/14(火) 16:59:18ID:XVd9AXqN

macでは':'
winでは'\'

215login:Penguin

2006/03/14(火) 23:40:20ID:SOaD9AK3

まあ、/とか考えるまでもなく、ファイルシステムに文字エンコードは影響するし。

216login:Penguin

2006/03/15(水) 00:06:00ID:FTGcTosr

>>214
Windowsも内部的には'/'だよ

217login:Penguin

2006/03/15(水) 00:20:57ID:T9FwIHLt

あほ

218login:Penguin

2006/03/18(土) 14:10:06ID:007Os0Uq

>>216
あ、そなの？知らなかった。

219login:Penguin

2006/03/18(土) 16:17:10ID:akdUDpD2

>>216
ソース

220login:Penguin

2006/03/18(土) 17:46:45ID:KLdgQbg+

NT系列では'\'が本則みたいだねえ。システムコールはもちろんどちらでも
受け付けるけど。
>>219
この一連の議論参照

221login:Penguin

2006/03/18(土) 19:56:18ID:TivuVR12

システムコールがどちらも受け付けるからといって、
内部の扱いかどうかなんてわからんだろ。
ソースかバイナリを追った結果でもどこかにでてるんなら別だけど。

222login:Penguin

2006/03/18(土) 20:07:38ID:KLdgQbg+

おっと失礼。この一連の議論ね。
http://mail.python.org/pipermail/python-list/2003-September/185195.html

>>221
DOS2.11は/だったが、(ソースは見た)、今は全く違っていても不思議はないね。

223login:Penguin

2006/03/18(土) 20:10:35ID:rRI0eBQC

>>222
もしかして、脳晦の容量不足している？

224login:Penguin

2006/03/19(日) 00:37:05ID:wDljjOw3

JFSのunicodeってなに?
UCS4?

225login:Penguin

2006/03/19(日) 03:30:27ID:cmjBOE+n

無意味に煽ってる奴のほうがよっぽど顔悪く見える

226login:Penguin

2006/03/19(日) 13:45:56ID:zdRlaDhI

>>225
そうやって無意味に煽るのはやめなさい。

227login:Penguin

2006/03/19(日) 13:52:08ID:UpbZdusV

>>224
UCS2かUTF-16だとおもわれ。

228login:Penguin

2006/03/21(火) 01:13:28ID:M+2sG4Eb

>>222
DOSは switcher を変えると / *も* 使えるようになるだけだ

229login:Penguin

2006/03/23(木) 17:04:49ID:YW27Dazl

日本語はさ、1カラム文字と2カラム文字しかないけど
他の言語には３カラム文字とか４カラム文字とかあるの？
端末上で半角３文字分とか４文字分の文字。

230login:Penguin

2006/03/23(木) 19:27:17ID:tr7Z4cN+

>>229
画面に出る時の幅のことを言っているの? プロポーショナルフォントは
W と i で幅が何倍も違うな。

231login:Penguin

2006/03/23(木) 19:28:31ID:tr7Z4cN+

はっ。しまった。あからさまな釣りか。

232login:Penguin

2006/03/23(木) 20:01:27ID:YW27Dazl

>>230
固定幅のフォントでの話です。
普通の日本語対応の端末エミュレータの場合そうでしょう？
端的に言って日本語以外だとwcswidthで3や4が返る可能性があるのかないのかなんですけど。

233login:Penguin

2006/03/23(木) 22:40:43ID:KIoq1Iks

unicode とそうでないので混じってるみたいだけど、
emacs の HELLO ファイルみると
(debian だと /usr/share/emacs/22.0.50/etc/HELLO)
Hindi とか Malayalam とか Kannada とかの
フォントセットのところに3とか4の文字がある。

234login:Penguin

2006/03/23(木) 22:57:17ID:YW27Dazl

>>233
ああ、やっぱあるのか。カラム数４ってどんな文字だorz
ありがとー。ちょっと対応を考えないといけないな。

235login:Penguin

2006/03/24(金) 01:34:23ID:JGNnmuyn

unicodeって、リガチャがあるから面倒くさい。死ね。

236login:Penguin

2006/03/24(金) 17:08:59ID:u8A96IKS

>>234
アラビア文字みたいに横に伸びる文字なんじゃないかな。
日本語も実際には伸びる時がある(「おーーーーい」という
時の「ーーー」の部分とか)が、それを普通の文語体の文章
ではあまり使わないから困らないだけだ。

スレをまとめに
5ch即うp → gzo.ai

■ このスレッドは過去ログ倉庫に格納されています