文字列がそのエンコーディングにおいて不正なバイト列である場合に発生する例外。
通常エンコーディング変換時に発生します。
"\x82\xa0".force_encoding("cp932").encode("UTF-8")
#=> "あ"
"\x82\xa0".force_encoding("EUC-JP").encode("UTF-8")
#=> Encoding::InvalidByteSequenceError: "\x82" on EUC-JP
destination_encoding -> Encoding[permalink][rdoc]エラーを発生させた変換の変換先のエンコーディングを Encoding オブジェクトで返します。
[SEE_ALSO] Encoding::InvalidByteSequenceError#source_encoding, Encoding::UndefinedConversionError#destination_encoding
destination_encoding_name -> String[permalink][rdoc]エラーを発生させた変換の変換先のエンコーディングを文字列で返します。
[SEE_ALSO] Encoding::InvalidByteSequenceError#destination_encoding
error_bytes -> String[permalink][rdoc]エラー発生時に捨てられたバイト列を返します。
ec = Encoding::Converter.new("EUC-JP", "ISO-8859-1")
begin
ec.convert("abc\xA1\xFFdef")
rescue Encoding::InvalidByteSequenceError
p $!
#=> #<Encoding::InvalidByteSequenceError: "\xA1" followed by "\xFF" on EUC-JP>
puts $!.error_bytes.dump #=> "\xA1"
puts $!.readagain_bytes.dump #=> "\xFF"
end
[SEE_ALSO] Encoding::InvalidByteSequenceError#readagain_bytes
incomplete_input? -> bool[permalink][rdoc]エラー発生時に入力文字列が不足している場合に真を返します。
つまり、マルチバイト文字列の途中で文字列が終わっている場合に真を返します。これは後続の入力を追加することでエラーが解消する可能性があることを意味します。
ec = Encoding::Converter.new("EUC-JP", "ISO-8859-1")
begin
ec.convert("abc\xA1z")
rescue Encoding::InvalidByteSequenceError
p $!
#=> #<Encoding::InvalidByteSequenceError: "\xA1" followed by "z" on EUC-JP>
p $!.incomplete_input? #=> false
end
begin
ec.convert("abc\xA1")
ec.finish
rescue Encoding::InvalidByteSequenceError
p $! #=> #<Encoding::InvalidByteSequenceError: incomplete "\xA1" on EUC-JP>
p $!.incomplete_input? #=> true
end
readagain_bytes -> String[permalink][rdoc]エラー発生時に読み直さなければならないバイト列を返します。
source_encoding -> Encoding[permalink][rdoc]エラーを発生させた変換の変換元のエンコーディングを Encoding オブジェクトで返します。
[SEE_ALSO] Encoding::InvalidByteSequenceError#destination_encoding, Encoding::UndefinedConversionError#source_encoding
source_encoding_name -> Encoding[permalink][rdoc]エラーを発生させた変換の変換元のエンコーディングを文字列で返します。
[SEE_ALSO] Encoding::InvalidByteSequenceError#source_encoding