Spaces:
Duplicated from Xanthius/llama-token-counter

ct-2
/

llama-token-counter

App Files Files Community

llama-token-counter / app.py

ct-2's picture

Duplicate from Xanthius/llama-token-counter

31ef55f about 1 year ago

history blame contribute delete

341 Bytes

	from sentencepiece import SentencePieceProcessor
	import gradio as gr

	sp = SentencePieceProcessor(model_file="tokenizer.model")

	def tokenize(input_text):
	tokens = sp.EncodeAsIds(input_text)
	return f"Number of tokens: {len(tokens)}"

	iface = gr.Interface(fn=tokenize, inputs=gr.inputs.Textbox(lines=7), outputs="text")
	iface.launch()